Lỗi 404: Là gì và cách khắc phục triệt để

Lỗi 404: Là gì và cách khắc phục triệt để
David Kaufmann
Hướng dẫn SEO
11 min read

Dù bạn có làm việc trong lĩnh vực dịch vụ SEO hay không, chắc chắn không ít lần bạn đã gặp phải lỗi 404 khét tiếng khi nhấp vào một trang web. Nếu với tư cách người dùng, trải nghiệm này đã khá tiêu cực, bạn có thể tưởng tượng nó gây hại bao nhiêu cho thứ hạng SEO của một trang web. Tại sao? Lỗi 404 là gì? Hậu quả ra sao?

Chúng tôi sẽ giải đáp dưới đây:

Lỗi 404 là gì?

Lỗi 404, "không tìm thấy tệp," là một mã trạng thái của giao thức HTTP mà trình duyệt hiển thị khi người dùng cố gắng truy cập một trang không thể tìm thấy. Loại phản hồi này cho biết rằng trình duyệt đã có thể thiết lập kết nối với máy chủ nhưng không thể tìm thấy tài nguyên được yêu cầu, vì vậy máy chủ trả về phản hồi quen thuộc này cho trình duyệt.

Một trong những nhiệm vụ của chuyên gia tư vấn SEO là theo dõi số lượng "lỗi 404," để đánh giá và cung cấp giải pháp cho từng trường hợp. Không làm như vậy không chỉ có thể gây hại đến hình ảnh thương hiệu của trang web mà còn tổn hại đến thứ hạng tự nhiên nếu để mất kiểm soát.

Ví dụ http 404 1200x750.png
Ví dụ http 404 1200x750.png

Tại sao? Bởi vì, mặc dù đây là những mã hoàn toàn bình thường được mong đợi trong hành vi của một trang web khi chúng ta gặp một trang không tồn tại, Google (hoặc bất kỳ công cụ tìm kiếm nào khác) đều nhận ra chúng.

Trong trường hợp các URL có giá trị SEO, PageRank của chúng sẽ bị giảm giá trị và chúng sẽ mất thứ hạng tự nhiên, điều này rõ ràng có nghĩa là số lượt nhấp sẽ giảm. Hơn nữa, nếu các bot thu thập dữ liệu của công cụ tìm kiếm gặp tỷ lệ phần trăm cao các URL có lỗi 404 trong một trang web, chúng kết luận rằng không có sự bảo trì đúng đắn đằng sau đó. Và nếu chúng hiểu điều này, chúng suy ra rằng trải nghiệm người dùng sẽ kém trên toàn bộ trang web, điều này sẽ tổn hại đến thứ hạng ở cấp độ tên miền.

Và đó là chưa tính đến việc nó sẽ 'chỉ' hạ vị trí của chúng ta trong SERP, bởi vì nó thậm chí có thể hủy lập chỉ mục một URL mà chúng ta muốn xếp hạng. Kịch bản trong trường hợp này tệ hơn đáng kể.

Bây giờ, chúng ta đừng nhầm lẫn mã lỗi phản hồi 404 với trạng thái 410. Trong khi cái trước cho biết đây là tình huống tạm thời, 410 là phản hồi mà máy chủ cung cấp khi trang đã bị xóa và không được mong đợi sẽ trở lại. Nghĩa là, Google đánh dấu chúng là đã bị xóa vĩnh viễn.

Nếu bạn muốn tìm hiểu thêm một chút về chủ đề này, bạn có thể xem cách Google phân biệt 404 với 410:

Matt Cutts, người đứng đầu việc duy trì chất lượng tìm kiếm tại Google, giải thích quy trình cần tuân theo cho từng mã lỗi này.

Nguyên nhân của lỗi 404

Các lý do khiến máy chủ có thể trả về "lỗi 404 – không tìm thấy" có thể được tóm tắt như sau:

  • Một URL đã bị xóa cố ý hoặc do nhầm lẫn, vì vậy nếu chúng ta cố gắng truy cập, nội dung sẽ không còn ở đó và chúng ta sẽ thấy trang có lỗi 404.

  • Bạn thay đổi tên miền mà không di chuyển các trang đã xuất bản trên tên miền cũ sang tên miền mới này. Bằng cách không thực hiện chuyển hướng 301, bất kỳ ai truy cập các trang đó sẽ gặp lỗi 404.

  • Chúng ta gõ sai URL trong trình duyệt, vì vậy vì nó không tồn tại do chưa bao giờ được tạo, chúng ta nhận được phản hồi này.

Tìm lỗi 404 ở đâu để xác định giải pháp

Trước khi xem phải làm gì với loại URL này và xác định giải pháp cho từng URL, đầu tiên, chúng ta cần định vị và báo cáo chúng. Để làm điều này, chúng ta có nhiều công cụ SEO sẽ giúp chúng ta tìm và theo dõi chúng. Trong số nhiều công cụ có sẵn, chúng tôi thường xuyên sử dụng:

Screaming Frog Spider

Screaming Frog là một công cụ rất đáng tin cậy và không thể thiếu để trích xuất lỗi 404, cũng như để hiểu trạng thái của một trang web ở nhiều khía cạnh khác. Đó là công cụ bắt buộc phải có cho người làm SEO.

Screaming Frog SEO
Screaming Frog SEO

Công cụ trực tuyến

Sử dụng các tài nguyên trực tuyến như www.brokenlinkcheck.com và các tiện ích mở rộng Chrome tiện dụng như Broken Link Checker.

Google Analytics

Một trong những cách bạn có thể phát hiện ra rằng nhiều HTTP 404 đang xảy ra là thông qua tỷ lệ thoát. Nếu chỉ số này quá cao, có thể nguyên nhân là do có số lượng lớn URL với mã trạng thái 404.

Để kiểm tra dứt khoát bao nhiêu người dùng đã đến một URL có lỗi 404 trong một khoảng thời gian nhất định, bạn có thể vào bảng điều khiển, truy cập tab báo cáo > hành vi > nội dung trang web > tất cả các trang. Sau đó nhập 404 vào thanh tìm kiếm và nó sẽ trả về báo cáo về số phiên đã được ghi nhận trên trang này.

Xem lỗi Google Analytics 404 1200x68.png
Xem lỗi Google Analytics 404 1200x68.png

Google Search Console:

Cũng giống như với Analytics, bạn có thể sử dụng Search Console để tìm các trang có mã 404 được hiển thị tự động sau khi được bot của Google thu thập dữ liệu. Bạn chỉ cần nhấp vào tùy chọn Chỉ mục bao phủ và xem lại URL nào xuất hiện là 'URL đã gửi không tìm thấy (404)'.

Lỗi 404 Search Console
Lỗi 404 Search Console

Hãy nhớ rằng chúng có thể được lập chỉ mục hoặc không, vì vậy bạn nên điều tra tất cả các tùy chọn (tức là cả trong 'trang có lỗi' và 'trang bị loại trừ').

Giải pháp đúng cho từng lỗi 404

Đối với tất cả các URL mà chúng ta đã phát hiện vẫn còn lỗi 404 tại thời điểm đánh giá, chúng ta sẽ đánh giá cách hành động dựa trên vấn đề chúng ta gặp phải:

Thiết lập chuyển hướng 301

Hãy tưởng tượng rằng, do nhầm lẫn, bạn gõ sai một URL (số 1), xuất bản nó, và sau đó xóa nó. Sau khi bạn đã xây dựng trang với URL đúng (số 2) và xuất bản lại, để ngăn URL đầu tiên bị lỗi 404, chúng ta sẽ thực hiện chuyển hướng 301 từ URL số 1 sang URL số 2.

Cũng có thể là bạn đã gỡ bỏ một trang tạm thời, nhưng nó có lượt truy cập và được liên kết từ các trang khác, dù trong tên miền của chính bạn hoặc từ các tên miền khác. Trong trường hợp như vậy, chúng tôi khuyên bạn nên thực hiện chuyển hướng 301 đến một trang khác có nội dung tương tự. Nếu không có, hãy chuyển hướng nó đến danh mục cấp cao hơn mà nó thuộc về. Phương án cuối cùng, nếu bạn không có lựa chọn nào khác, hãy chuyển hướng đến trang chủ. Tức là, chuyển hướng bằng cách sử dụng 301, nhưng làm điều đó với mục đích!

Gửi lỗi 410

Lỗi 404 không giống với 410, như chúng ta đã thấy trước đó. Nếu trang không được tìm thấy nhưng chúng ta không muốn Google hiểu rằng đó là tình huống tạm thời, chúng ta sẽ chọn triển khai 410. Điều đó nói rằng, trước khi thực hiện bước này, hãy đảm bảo nó được cô lập khỏi các liên kết trỏ đến nó. Bằng cách này, Google sẽ kết thúc việc hủy lập chỉ mục vĩnh viễn URL đó khỏi cơ sở dữ liệu của mình và nó sẽ không được tính đến khi xếp hạng trong SERP.

Các giải pháp thay thế trước khi gửi 404

Có thể là bạn có một trang thương mại điện tử và đã quyết định tạm thời gỡ bỏ một sản phẩm khỏi kho. Vâng, trước khi xóa nó, hãy suy nghĩ về điều đó: tại sao không giữ nó được xuất bản bằng cách duy trì yêu cầu 200, cho biết bạn hiện không có sản phẩm đó, nhưng đề xuất cơ hội truy cập các trang có sản phẩm hoặc dịch vụ tương tự thông qua các liên kết mà người dùng sẽ thấy trên cùng trang đó? Nếu sau này bạn có lại sản phẩm đó, URL đó vẫn sẽ tồn tại và mặc dù có thể uy tín và thứ hạng của nó sẽ giảm trong một thời gian, bạn sẽ tốn ít công sức hơn để đưa nó xếp hạng trở lại trong kết quả tìm kiếm so với việc phải bắt đầu từ một URL mới.

Tạo trang lỗi 404 tùy chỉnh của riêng bạn

Tại sao tùy chỉnh trang lỗi?

Liên quan đến những gì chúng tôi đã đề cập ở đoạn trước, có lẽ bạn không đồng ý; có lẽ bạn muốn Google hiểu rằng đó là 404. Chỉ vậy thôi. Vâng, trong trường hợp đó, đừng hài lòng với việc hiển thị cho người dùng trang lỗi 404 tiêu chuẩn điển hình. Tùy chỉnh nó bằng cách cung cấp nội dung tương tự với những gì người dùng đang tìm kiếm và lý do họ đến trang web của bạn. Bằng cách này, bạn sẽ không chỉ làm cho họ có được sự gắn kết với bạn với tư cách là một thương hiệu, mà có lẽ họ sẽ tiếp tục duyệt trang web của bạn.

Lỗi 404 Chess.com
Lỗi 404 Chess.com

Ví dụ về các trang 404 sáng tạo

Có nhiều cách để ngăn người dùng nhanh chóng rời khỏi trang có mã 404. Nhưng để làm điều này, bạn phải hiển thị cho họ nội dung quan tâm để đáp lạisáng tạo trong cách hiển thị nó. Ví dụ, chúng ta có thể bao gồm một tìm kiếm nội bộ rất dễ thấy để từ trang đó, họ có tùy chọn truy cập các trang khác có thể có nội dung tương tự với những gì họ đang tìm kiếm ban đầu.

Thông qua các trang có lỗi 404, chúng ta cũng có thể thêm biểu mẫu liên hệ, đăng ký bản tin, và thậm chí các liên kết trực tiếp đến nội dung tương tự với những gì họ đang tìm kiếm. Bất cứ khi nào có ý nghĩa, bạn sẽ giúp người dùng chọn tiếp tục truy cập các trang khác trên trang web của bạn.

Và, nếu bạn không có gì để cung cấp, ít nhất hãy cố gắng làm họ mỉm cười với một thông điệp được cá nhân hóa cho biết rằng họ đã đến một URL không có gì để xem.

Hãy xem một ví dụ tốt trong đó trang này đã được tùy chỉnh và đã thu hút sự chú ý:

Lego 404 các bài viết liên quan 1200x858.jpg
Lego 404 các bài viết liên quan 1200x858.jpg

Kết luận về lỗi 404

Để cho lỗi 404 trôi nổi có thể trở thành một cơn đau đầu lớn cho cả người dùng của bạn và bạn, nếu bạn đầu tư vào việc chuyển đổi thông qua một trang web. Theo dõi chúng và đưa ra quyết định về việc phải làm gì với chúng thường xuyên; bạn sẽ tránh được trải nghiệm tệ, ít hiển thị tự nhiên, ít lượt nhấp và ít chuyển đổi hơn.

Bạn có đồng ý không? Bạn có muốn thêm điều gì khác không? Hãy cho chúng tôi biết trong phần 'Bình luận' bạn sẽ thấy ngay bên dưới!

Tác giả: David Kaufmann

David Kaufmann

Tôi đã dành hơn 10 năm qua hoàn toàn đắm chìm trong SEO — và thành thật mà nói, tôi không muốn điều gì khác thay thế.

Sự nghiệp của tôi bước sang một tầm cao mới khi tôi làm việc với vai trò chuyên gia SEO cấp cao tại Chess.com — một trong 100 website được truy cập nhiều nhất trên toàn bộ internet. Vận hành ở quy mô đó, trên hàng triệu trang, hàng chục ngôn ngữ và trong một trong những SERPs cạnh tranh khốc liệt nhất, đã dạy tôi những điều mà không khóa học hay chứng chỉ nào có thể mang lại. Trải nghiệm đó đã thay đổi cách tôi nhìn nhận về SEO thực sự xuất sắc — và trở thành nền tảng cho mọi thứ tôi xây dựng từ đó đến nay.

Từ kinh nghiệm ấy, tôi đã sáng lập SEO Alive — một agency dành cho những thương hiệu thực sự nghiêm túc với tăng trưởng organic. Chúng tôi không ở đây để bán dashboards và báo cáo hàng tháng. Chúng tôi ở đây để xây dựng những chiến lược thực sự tạo ra chuyển biến, kết hợp tinh hoa của SEO truyền thống với thế giới mới đầy thú vị của Generative Engine Optimization (GEO) — đảm bảo thương hiệu của bạn không chỉ xuất hiện trong các liên kết xanh của Google, mà còn hiện diện ngay trong những câu trả lời do AI tạo ra mà ChatGPT, Perplexity và Google AI Overviews đang cung cấp cho hàng triệu người mỗi ngày.

Và bởi vì tôi không thể tìm được một công cụ xử lý tốt cả hai thế giới đó, tôi đã tự xây dựng một công cụ — SEOcrawl, một nền tảng SEO intelligence cấp doanh nghiệp tích hợp rankings, kiểm tra kỹ thuật, giám sát backlinks, tình trạng crawl và theo dõi hiển thị thương hiệu trên AI, tất cả trong một nơi. Đó chính là nền tảng mà tôi luôn ước có.

→ Đọc tất cả bài viết của David
Thêm bài viết của David Kaufmann

Khám phá thêm nội dung của tác giả này