Blocked Due to Other 4xx Issue: Cách khắc phục

Blocked Due to Other 4xx Issue: Cách khắc phục

Bạn mở Search Console, và nó xuất hiện ngay đó: Chưa lập chỉ mục: "Blocked due to other 4xx issue." Không có mã trạng thái, không có tệp bị ảnh hưởng, không có nguyên nhân rõ ràng.

Hướng dẫn này giải thích chính xác lỗi nào kích hoạt nhãn đó, cách tìm mã trạng thái thực sự đằng sau nó, và cách khắc phục từng nguyên nhân — bao gồm những bước chẩn đoán mà hầu hết bài viết bỏ qua. Để biết báo cáo này nằm ở đâu trong công cụ rộng hơn, hãy xem hướng dẫn Google Search Console đầy đủ của chúng tôi.

"Blocked due to other 4xx issue" thực sự nghĩa là gì

"Blocked due to other 4xx issue" nghĩa là Googlebot đã yêu cầu một URL và nhận được phản hồi 4xx (phía máy khách) mà Search Console chưa tách riêng thành danh mục của nó.

Vì Google không thể lấy được trang, nó sẽ không lập chỉ mục. Trong những trường hợp này, URL nằm ngoài kết quả tìm kiếm cho đến khi nó trả về một trạng thái thành công.

Từ "other" (khác) chính là điểm mấu chốt ở đây. Search Console đã có nhãn riêng cho ba mã 4xx phổ biến nhất:

  • 401 → "Blocked due to unauthorized request (401)."
  • 403 → "Blocked due to access forbidden (403)."
  • 404 → "Not found (404)."

Vì vậy "other 4xx" trở thành cái ô bao trùm mọi thứ còn lại trong dải 4xx: 400, 405, 408, 410, 429 và các mã tương tự. Thông báo mơ hồ vì Google biết đã xảy ra một lỗi 4xx, nhưng đó không phải là mã mà họ đã gắn nhãn.

Những mã trạng thái 4xx nào kích hoạt lỗi này

Đây là những mã thường rơi vào nhãn này nhất. Bạn cần xác định máy chủ của mình thực sự đang trả về mã nào trước khi có thể khắc phục bất cứ điều gì.

TênTác nhân điển hình
400Bad RequestURL bị lỗi định dạng, ký tự không hợp lệ, yêu cầu bị hỏng
405Method Not AllowedMáy chủ từ chối phương thức yêu cầu (ví dụ GET bị vô hiệu trên đường dẫn đó)
406Not AcceptableKhông khớp thương lượng nội dung
408Request TimeoutMáy chủ phản hồi quá chậm trong khoảng thời gian cho phép
410GoneTrang bị xóa vĩnh viễn (xem lưu ý bên dưới)
411 / 412 / 421 / 422Nhiều loạiCác vấn đề về length / precondition / misdirected / unprocessable request
429Too Many RequestsGiới hạn tần suất (nguyên nhân rất phổ biến trên các website lớn hoặc được bảo vệ nghiêm ngặt)
451Unavailable for Legal ReasonsChặn theo địa lý / pháp lý
418I'm a teapotMột mã trạng thái đùa được định nghĩa trong một RFC (hiếm gặp, nhưng là mã thật mà một số cấu hình đôi khi trả về)

Lưu ý về 410 (Gone): nếu một trang được cố ý xóa vĩnh viễn, 410 là phản hồi đúng và bạn không nên "khắc phục" nó. Chỉ cần đảm bảo đó không phải là trang bạn thực sự muốn lập chỉ mục.

Điều gì gây ra lỗi 4xx cho Googlebot

Hầu hết các trường hợp đều bắt nguồn từ một trong năm nguyên nhân này:

Năm nguyên nhân phổ biến nhất của "blocked due to other 4xx issue" đối với Googlebot: quy tắc bảo mật và WAF trả về 403, giới hạn tần suất trả về 429, cấu hình máy chủ hoặc CDN, URL tham số bị lỗi định dạng trả về 400, và quyền truy cập tệp quá chặt
Năm nguyên nhân đằng sau hầu hết các báo cáo "blocked due to other 4xx issue"
  • Quy tắc bảo mật và WAF. Các tường lửa như Cloudflare, Sucuri hoặc AWS WAF đôi khi nhận nhầm Googlebot là mối đe dọa và trả về 403 hoặc chặn yêu cầu. Các plugin bảo mật trên WordPress cũng có thể làm điều tương tự.
  • Giới hạn tần suất (429). Máy chủ trả về 429 khi cho rằng có quá nhiều yêu cầu đến quá nhanh, và Google sẽ không lập chỉ mục một trang mà nó liên tục bị giới hạn tần suất.
  • Cấu hình máy chủ hoặc CDN. Một quy tắc CDN, một chỉ thị .htaccess, hoặc một thay đổi template có thể bắt đầu trả về 4xx trên các URL vốn hiển thị bình thường trong trình duyệt của bạn.
  • URL bị lỗi định dạng (400). 400 nghĩa là máy chủ không hiểu được yêu cầu — thường là cấu trúc URL sai hoặc tham số xấu. Điều này phổ biến với điều hướng phân loại và tham số phiên / theo dõi.
  • Quyền truy cập tệp. Quyền thư mục được thiết lập quá chặt (ví dụ 700 thay vì 755) có thể kích hoạt 403.

Một dấu hiệu hữu ích: vì đây là các phản hồi phía máy khách gắn với cách yêu cầu được thực hiện, bạn thường sẽ không thấy cùng lỗi đó trong trình duyệt của chính mình — và đó chính xác là lý do báo cáo này gây cảm giác mù mờ đến vậy.

Cách tìm mã trạng thái 4xx chính xác mà Google gặp phải

Search Console cho bạn biết một trang bị ảnh hưởng nhưng không cho biết nó trả về mã 4xx nào. Bạn phải tự tìm ra điều đó. Hãy thực hiện theo trình tự sau:

  1. Liệt kê các URL bị ảnh hưởng. Trong Search Console, vào Lập chỉ mục → Trang, cuộn đến "Lý do trang không được lập chỉ mục", và nhấp "Blocked due to other 4xx issue" để xem danh sách đầy đủ. Chúng nằm trong mục Trang → tab Chưa lập chỉ mục.
  2. Kiểm tra một URL. Nhấp vào một URL, sau đó Kiểm tra URL trực tiếp trong công cụ Kiểm tra URL. Nó hiển thị chính xác những gì Googlebot đã thấy, bao gồm phản hồi HTTP và bất kỳ chuyển hướng nào.
  3. Lấy dưới danh nghĩa Googlebot. Vì lỗi thường đặc thù theo user agent, hãy tái hiện nó bằng user agent Googlebot. Trong Chrome DevTools, mở tab Network conditions, bỏ chọn "Use browser default," và chọn "Googlebot Smartphone," rồi tải lại và đọc mã trạng thái. Bạn cũng có thể chạy curl -A "Googlebot" -I https://yoururl từ terminal.
  4. Kiểm tra nhật ký máy chủ. Nhật ký hiển thị mã trạng thái thực sự mà máy chủ của bạn đã trả về cho các IP của Google, đây là sự thật xác thực khi DevTools và trình duyệt mâu thuẫn nhau.
  5. Xác minh đó thực sự là Googlebot. Nếu một WAF đang chặn, hãy xác nhận IP đang yêu cầu thực sự thuộc về Google trước khi bạn mở rộng quyền truy cập, để không mở cửa cho các bot giả mạo.
Terminal hiển thị curl -A Googlebot -I đối với một URL và nhận được phản hồi HTTP 429 Too Many Requests, tiết lộ mã trạng thái chính xác mà Search Console ẩn sau nhãn "other 4xx"
Lấy một URL bằng user agent Googlebot tiết lộ mã trạng thái thực sự — ở đây là một mã 429 do giới hạn tần suất

Cách khắc phục từng lỗi 4xx, theo từng mã

Một khi bạn biết mã, cách khắc phục sẽ theo đó mà ra:

Mã 4xxNguyên nhân có thểCách khắc phục
403WAF hoặc tường lửa chặn GooglebotCho phép Googlebot đã xác minh vào danh sách trắng, hoặc điều chỉnh quy tắc đang bắt nó. Sửa quyền truy cập tệp nếu đó là nguyên nhân.
429Giới hạn tần suấtTăng hoặc tinh chỉnh giới hạn tần suất cho các bot tìm kiếm đã xác minh, và kiểm tra xem có plugin hoặc CDN nào đang bóp nghẹt việc thu thập dữ liệu không.
400URL bị lỗi định dạngSửa cấu trúc URL, ngừng tạo các tổ hợp tham số không hợp lệ, và chuẩn hóa (canonicalize) các URL có tham số.
405 / 406 / 408Quy tắc máy chủ, thương lượng nội dung, hoặc timeoutSửa quy tắc phía máy chủ, thương lượng nội dung, hoặc hành vi timeout cho các đường dẫn bị ảnh hưởng.
410 (lẽ ra không nên biến mất)Trang bị xóa nhầmKhôi phục trang, hoặc chuyển hướng 301 đến trang tương đương gần nhất nếu nó có giá trị và backlink.
404 / 410 (cố ý)URL thực sự đã chếtCứ để nguyên. Đây không phải lỗi cần khắc phục. Ngăn lãng phí thu thập dữ liệu bằng robots.txt nếu số lượng lớn.

Cách xác thực bản sửa lỗi 4xx trong Search Console

Sau khi khắc phục nguyên nhân gốc, hãy quay lại báo cáo "Blocked due to other 4xx issue" và nhấp Xác thực bản sửa lỗi.

Chi tiết xác thực của Search Console cho seocrawl.ai sau khi nhấp Xác thực bản sửa lỗi, hiển thị trạng thái xác thực với số lượng URL đang chờ và thất bại cùng các URL ví dụ đang được thu thập lại
Sau khi bạn nhấp Xác thực bản sửa lỗi, Search Console theo dõi việc thu thập lại tại đây — các URL đang chờ vẫn đang được kiểm tra và thường mất từ vài ngày đến vài tuần

Google sẽ thu thập lại các URL bị ảnh hưởng; việc thu thập lại các URL đã sửa thường mất từ vài ngày đến vài tuần tùy thuộc vào ngân sách thu thập dữ liệu.

Báo cáo được cập nhật khi Google thử lại từng URL, nên các bản sửa lỗi gần đây sẽ không hiển thị ngay lập tức. Hãy giữ công cụ Kiểm tra URL bên cạnh để xác nhận mỗi trang giờ trả về 200 trước khi bạn dựa vào kết quả xác thực.

Tìm các URL bị ảnh hưởng bởi 4xx ở quy mô lớn với SEOcrawl AI

Search Console cho thấy vấn đề nhưng buộc bạn phải kiểm tra từng URL một. SEOcrawl AI kéo dữ liệu độ phủ Search Console của bạn và hiển thị các trạng thái lập chỉ mục trên toàn bộ website, nhờ đó bạn có thể phát hiện các URL bị ảnh hưởng hàng loạt thay vì nhấp qua từng cái một.

Máy chủ MCP của chúng tôi cho phép bạn đọc bảng phân tích đầy đủ về độ phủ chỉ mục theo trạng thái và lọc các trang đã thu thập theo mã trạng thái (ví dụ, tất cả những trang trả về 404) trực tiếp từ Claude hoặc ChatGPT, và gắn thẻ chúng theo quy tắc, thủ công, hoặc qua MCP. Kết hợp điều đó với thu thập dữ liệu theo lịch và cảnh báo để bạn bắt được đợt tăng đột biến URL 4xx trước khi nó làm tổn hại thứ hạng của bạn.

Kết quả MCP dạng trò chuyện, trong đó người dùng yêu cầu mọi trang đã thu thập trên seocrawl.ai trả về trạng thái 4xx và SEOcrawl AI trả lời bằng một bảng URL cùng mã trạng thái của chúng — 404, 403, 429, 410 và 400 — được kéo về hàng loạt qua MCP
Hỏi Claude hoặc ChatGPT về mọi URL bị ảnh hưởng bởi 4xx và SEOcrawl AI trả về chúng qua MCP — không cần kiểm tra từng URL một

Tìm mọi URL bị ảnh hưởng bởi 4xx ở một nơi. Thay vì nhấp qua Search Console từng URL một, SEOcrawl AI hiển thị bảng phân tích độ phủ chỉ mục đầy đủ của bạn và cho phép bạn lọc các trang đã thu thập theo mã trạng thái ngay từ Claude hoặc ChatGPT. Hãy thử SEOcrawl AI.

Câu hỏi thường gặp

Lỗi 4xx nghĩa là gì?

Lỗi 4xx là một trạng thái HTTP phía máy khách, nghĩa là bản thân yêu cầu không thể được thực hiện: trang không tìm thấy, quyền truy cập bị từ chối, yêu cầu bị lỗi định dạng, hoặc máy chủ đang giới hạn tần suất.

Nhóm 4xx bao gồm 400 (bad request), 403 (forbidden), 404 (not found), 410 (gone) và 429 (too many requests), cùng nhiều mã khác. Về mặt SEO, bất kỳ lỗi 4xx nào trên trang bạn muốn lập chỉ mục đều là vấn đề, vì Google không thể lấy nội dung để xếp hạng.

Lỗi 4xx có hại cho SEO không?

Có, khi chúng ảnh hưởng đến các trang bạn muốn có trong chỉ mục. Một trang trả về 4xx không thể được thu thập dữ liệu, nên sẽ không được lập chỉ mục hay xếp hạng, và bạn mất đi lưu lượng truy cập mà nó lẽ ra mang lại.

Ở quy mô lớn, lỗi 4xx lan rộng còn lãng phí ngân sách thu thập dữ liệu và có thể báo hiệu việc bảo trì website kém. Các lỗi 404 và 410 cố ý trên những URL thực sự đã chết là bình thường; vấn đề là phản hồi 4xx trên những trang lẽ ra phải hoạt động.

Lỗi 4xx trong SEO là gì?

Về mặt SEO, lỗi 4xx là bất kỳ phản hồi phía máy khách nào ngăn công cụ tìm kiếm truy cập một URL. Những mã quan trọng nhất là 404 (trang hỏng hoặc đã bị xóa), 403 (bị chặn truy cập, thường bởi tường lửa) và các mã đằng sau "blocked due to other 4xx issue" như 400, 429 và 410.

Làm sao để biết Google gặp mã 4xx nào?

Search Console không nêu tên mã, nên bạn phải tự kiểm tra. Mở URL bị ảnh hưởng trong công cụ Kiểm tra URL và chạy Kiểm tra URL trực tiếp để xem phản hồi, hoặc lấy trang bằng user agent Googlebot (trong bảng Network conditions của Chrome DevTools, hoặc bằng curl -A "Googlebot" -I [url]).

Nhật ký máy chủ cho biết mã trạng thái xác thực mà máy chủ của bạn đã trả về cho Google. Để thực hiện điều này trên nhiều URL cùng lúc, SEOcrawl AI cho phép bạn lọc các trang đã thu thập theo mã trạng thái hàng loạt.

Tác giả: David Kaufmann

David Kaufmann

Tôi đã dành hơn 10 năm qua hoàn toàn đắm chìm trong SEO — và thành thật mà nói, tôi không muốn điều gì khác thay thế.

Sự nghiệp của tôi bước sang một tầm cao mới khi tôi làm việc với vai trò chuyên gia SEO cấp cao tại Chess.com — một trong 100 website được truy cập nhiều nhất trên toàn bộ internet. Vận hành ở quy mô đó, trên hàng triệu trang, hàng chục ngôn ngữ và trong một trong những SERPs cạnh tranh khốc liệt nhất, đã dạy tôi những điều mà không khóa học hay chứng chỉ nào có thể mang lại. Trải nghiệm đó đã thay đổi cách tôi nhìn nhận về SEO thực sự xuất sắc — và trở thành nền tảng cho mọi thứ tôi xây dựng từ đó đến nay.

Từ kinh nghiệm ấy, tôi đã sáng lập SEO Alive — một agency dành cho những thương hiệu thực sự nghiêm túc với tăng trưởng organic. Chúng tôi không ở đây để bán dashboards và báo cáo hàng tháng. Chúng tôi ở đây để xây dựng những chiến lược thực sự tạo ra chuyển biến, kết hợp tinh hoa của SEO truyền thống với thế giới mới đầy thú vị của Generative Engine Optimization (GEO) — đảm bảo thương hiệu của bạn không chỉ xuất hiện trong các liên kết xanh của Google, mà còn hiện diện ngay trong những câu trả lời do AI tạo ra mà ChatGPT, Perplexity và Google AI Overviews đang cung cấp cho hàng triệu người mỗi ngày.

Và bởi vì tôi không thể tìm được một công cụ xử lý tốt cả hai thế giới đó, tôi đã tự xây dựng một công cụ — SEOcrawl, một nền tảng SEO intelligence cấp doanh nghiệp tích hợp rankings, kiểm tra kỹ thuật, giám sát backlinks, tình trạng crawl và theo dõi hiển thị thương hiệu trên AI, tất cả trong một nơi. Đó chính là nền tảng mà tôi luôn ước có.

→ Đọc tất cả bài viết của David
Thêm bài viết của David Kaufmann

Khám phá thêm nội dung của tác giả này