Blocked Due to Other 4xx Issue: com solucionar-ho

Blocked Due to Other 4xx Issue: com solucionar-ho
David Kaufmann
Tutorials SEO

Obres Search Console i allà hi és: Not indexed: "Blocked due to other 4xx issue." Sense codi d'estat, sense fitxer afectat, sense cap causa evident.

Aquesta guia explica exactament quins errors activen aquesta etiqueta, com trobar el codi d'estat real que hi ha al darrere i com solucionar-ne cada causa — inclosos els passos de diagnòstic que la majoria d'articles s'ometen. Per situar aquest informe dins de l'eina més àmplia, consulta la nostra guia completa de Google Search Console.

Què significa realment "blocked due to other 4xx issue"

"Blocked due to other 4xx issue" vol dir que el Googlebot ha sol·licitat una URL i ha rebut una resposta 4xx (del costat del client) que Search Console no desglossa en una categoria pròpia.

Com que Google no ha pogut recuperar la pàgina, no la indexarà. En aquests casos, la URL queda fora dels resultats de cerca fins que retorna un estat correcte.

La paraula "other" és la clau aquí. Search Console ja té etiquetes dedicades per als tres codis 4xx més habituals:

  • 401 → "Blocked due to unauthorized request (401)."
  • 403 → "Blocked due to access forbidden (403)."
  • 404 → "Not found (404)."

Així doncs, "other 4xx" es converteix en el paraigua per a tota la resta de l'interval 4xx: 400, 405, 408, 410, 429 i codis similars. El missatge és vague perquè Google sap que s'ha produït un 4xx, però no és cap dels que tenen etiquetat.

Quins codis d'estat 4xx activen aquest error

Aquests són els codis que més sovint acaben sota aquesta etiqueta. Cal identificar quin està retornant realment el teu servidor abans de poder solucionar res.

CodeNomActivador habitual
400Bad RequestURL mal formada, caràcters no vàlids, sol·licitud corrupta
405Method Not AllowedEl servidor rebutja el mètode de la sol·licitud (p. ex., GET desactivat en aquesta ruta)
406Not AcceptableDesajust en la negociació de contingut
408Request TimeoutEl servidor triga massa a respondre dins de la seva finestra
410GonePàgina eliminada permanentment (vegeu la nota de sota)
411 / 412 / 421 / 422DiversosProblemes de longitud / precondició / redirecció incorrecta / sol·licitud no processable
429Too Many RequestsLimitació de freqüència (una causa molt habitual en llocs grans o protegits de manera agressiva)
451Unavailable for Legal ReasonsBloqueig geogràfic / legal
418I'm a teapotUn estat de broma definit en un RFC (rar, però és un codi real que algunes configuracions retornen ocasionalment)

Una nota sobre el 410 (Gone): si una pàgina s'ha eliminat intencionadament per sempre, un 410 és la resposta correcta i no l'hauries de "solucionar". Només assegura't que no sigui una pàgina que realment vols indexar.

Què provoca els errors 4xx per al Googlebot

La majoria de casos es remunten a una d'aquestes cinc causes:

Les cinc causes més habituals de "blocked due to other 4xx issue" per al Googlebot: regles de seguretat i WAF que retornen 403, limitació de freqüència que retorna 429, configuració del servidor o la CDN, URL amb paràmetres mal formades que retornen 400 i permisos de fitxers massa restrictius
Les cinc causes que hi ha darrere de la majoria d'informes "blocked due to other 4xx issue"
  • Regles de seguretat i WAF. Tallafocs com Cloudflare, Sucuri o AWS WAF de vegades identifiquen erròniament el Googlebot com una amenaça i retornen un 403 o bloquegen la sol·licitud. Els connectors de seguretat de WordPress poden fer el mateix.
  • Limitació de freqüència (429). El servidor retorna un 429 quan decideix que han arribat massa sol·licituds massa de pressa, i Google no indexarà una pàgina on rep limitacions de freqüència de manera continuada.
  • Configuració del servidor o la CDN. Una regla de CDN, una directiva a .htaccess o un canvi de plantilla poden començar a retornar un 4xx en URL que es carreguen bé al teu navegador.
  • URL mal formades (400). Un 400 vol dir que el servidor no ha pogut entendre la sol·licitud — sovint una estructura d'URL incorrecta o paràmetres dolents. Això és habitual amb la navegació per facetes i els paràmetres de sessió / seguiment.
  • Permisos de fitxers. Uns permisos de directori establerts de manera massa restrictiva (p. ex., 700 en lloc de 755) poden activar un 403.

Una pista útil: com que són respostes del costat del client lligades a com es fa la sol·licitud, sovint no veuràs el mateix error al teu propi navegador — que és exactament per què aquest informe sembla tan opac.

Com trobar el codi d'estat 4xx exacte que ha trobat Google

Search Console t'indica que una pàgina està afectada, però no quin codi 4xx ha retornat. L'has de trobar tu mateix. Segueix aquesta seqüència:

  1. Llista les URL afectades. A Search Console, ves a Indexing → Pages, desplaça't fins a "Why pages aren't indexed" i fes clic a "Blocked due to other 4xx issue" per veure la llista completa. Es troben a la secció Pages → pestanya Not indexed.
  2. Inspecciona una URL. Fes clic en una URL i després a Test live URL a l'eina d'inspecció d'URL. Mostra exactament el que ha vist el Googlebot, inclosa la resposta HTTP i qualsevol redirecció.
  3. Descarrega com a Googlebot. Com que l'error sovint depèn de l'agent d'usuari, reprodueix-lo amb l'agent d'usuari del Googlebot. A les Chrome DevTools, obre la pestanya Network conditions, desmarca "Use browser default" i selecciona "Googlebot Smartphone", després torna a carregar i llegeix el codi d'estat. També pots executar curl -A "Googlebot" -I https://yoururl des d'un terminal.
  4. Comprova els registres del servidor. Els registres mostren el codi d'estat real que el teu servidor ha retornat a les IP de Google, que és la font de veritat quan les DevTools i el navegador no coincideixen.
  5. Verifica que sigui realment el Googlebot. Si un WAF està bloquejant, confirma que la IP que fa la sol·licitud pertany realment a Google abans d'ampliar l'accés, per no obrir la porta a bots suplantats.
Terminal que mostra curl -A Googlebot -I contra una URL i rep una resposta HTTP 429 Too Many Requests, revelant el codi d'estat exacte que Search Console amaga darrere de l'etiqueta "other 4xx"
Descarregar una URL amb l'agent d'usuari del Googlebot revela el codi d'estat real — aquí, un 429 per limitació de freqüència

Com solucionar cada error 4xx, codi a codi

Un cop coneixes el codi, la solució en deriva:

Codi 4xxCausa probableCom solucionar-ho
403WAF o tallafoc que bloqueja el GooglebotAfegeix el Googlebot verificat a la llista de permesos, o ajusta la regla que l'atrapa. Corregeix els permisos de fitxers si aquesta és la causa.
429Limitació de freqüènciaPuja o ajusta el límit de freqüència per als bots de cerca verificats, i comprova si un connector o una CDN estan estrangulant els rastreigs.
400URL mal formadaCorregeix l'estructura de la URL, deixa de generar combinacions de paràmetres no vàlides i canonicalitza les URL amb paràmetres.
405 / 406 / 408Regla del servidor, negociació de contingut o temps d'esperaCorregeix la regla del costat del servidor, la negociació de contingut o el comportament del temps d'espera per a les rutes afectades.
410 (no hauria d'estar eliminada)Pàgina eliminada per errorRestaura la pàgina, o redirigeix-la amb un 301 a l'equivalent més proper si té valor i enllaços entrants.
404 / 410 (intencionats)La URL està realment mortaDeixa-ho tal com està. No són errors a solucionar. Bloqueja el malbaratament de rastreig amb robots.txt si el volum és alt.

Com validar la solució del 4xx a Search Console

Després de solucionar la causa d'arrel, torna a l'informe "Blocked due to other 4xx issue" i fes clic a Validate fix.

Detalls de validació de Search Console per a seocrawl.ai després de fer clic a Validate fix, mostrant l'estat de la validació amb els recomptes d'URL pendents i fallides i exemples d'URL que s'estan tornant a rastrejar
Després de fer clic a Validate fix, Search Console fa el seguiment del nou rastreig aquí — les URL pendents encara s'estan comprovant i normalment triga de pocs dies a unes quantes setmanes

Google tornarà a rastrejar les URL afectades; tornar a rastrejar les URL corregides sol trigar de pocs dies a unes quantes setmanes segons el pressupost de rastreig.

L'informe s'actualitza a mesura que Google torna a intentar cada URL, així que les solucions recents no apareixeran a l'instant. Tingues a mà l'eina d'inspecció d'URL per confirmar que cada pàgina ara retorna un 200 abans de confiar en la validació.

Trobar les URL afectades per 4xx a gran escala amb SEOcrawl AI

Search Console mostra el problema però t'obliga a inspeccionar les URL d'una en una. SEOcrawl AI extreu les dades de cobertura del teu Search Console i mostra els estats d'indexació de tot el lloc, de manera que pots detectar les URL afectades de manera massiva en lloc de clicar-hi individualment.

El nostre servidor MCP et permet llegir el desglossament complet de la cobertura de l'índex per estat i filtrar les pàgines rastrejades per codi d'estat (per exemple, tot el que retorna un 404) directament des de Claude o ChatGPT, i etiquetar-les per regles, manualment o per MCP. Combina-ho amb rastreigs programats i alertes perquè detectis un pic d'URL 4xx abans que perjudiqui el teu posicionament.

Resultat en estil xat d'MCP on l'usuari demana totes les pàgines rastrejades de seocrawl.ai que retornen un estat 4xx i SEOcrawl AI respon amb una taula d'URL i els seus codis d'estat — 404, 403, 429, 410 i 400 — extrets de manera massiva per MCP
Demana a Claude o ChatGPT cada URL afectada per 4xx i SEOcrawl AI les retorna per MCP — sense inspeccionar les URL d'una en una

Troba totes les URL afectades per 4xx en un sol lloc. En lloc de clicar per Search Console URL a URL, SEOcrawl AI et mostra el desglossament complet de la cobertura de l'índex i et permet filtrar les pàgines rastrejades per codi d'estat directament des de Claude o ChatGPT. Prova SEOcrawl AI.

Preguntes freqüents

Què significa un error 4xx?

Un error 4xx és un estat HTTP del costat del client, cosa que vol dir que la mateixa sol·licitud no s'ha pogut completar: no es troba la pàgina, es denega l'accés, la sol·licitud està mal formada o el servidor n'està limitant la freqüència.

La família 4xx inclou 400 (bad request), 403 (forbidden), 404 (not found), 410 (gone) i 429 (too many requests), entre d'altres. Per al SEO, qualsevol 4xx en una pàgina que vols indexar és un problema, perquè Google no pot recuperar-ne el contingut per posicionar-lo.

Els errors 4xx són dolents per al SEO?

Ho són quan afecten pàgines que vols tenir a l'índex. Una pàgina que retorna un 4xx no es pot rastrejar, així que no s'indexarà ni es posicionarà, i perds el trànsit que hauria generat.

A gran escala, els errors 4xx generalitzats també malgasten el pressupost de rastreig i poden ser senyal d'un manteniment deficient del lloc. Els 404 i 410 intencionats en URL realment mortes són normals; el problema són les respostes 4xx en pàgines que haurien d'estar actives.

Què és un error 4xx en SEO?

En termes de SEO, un error 4xx és qualsevol resposta del costat del client que impedeix que els cercadors accedeixin a una URL. Els que importen més són els 404 (pàgines trencades o eliminades), els 403 (accés bloquejat, sovint per un tallafoc) i els codis que hi ha darrere de "blocked due to other 4xx issue", com ara 400, 429 i 410.

Com puc saber quin 4xx ha trobat Google?

Search Console no en dona el nom del codi, així que l'has d'inspeccionar tu mateix. Obre la URL afectada a l'eina d'inspecció d'URL i executa Test live URL per veure la resposta, o descarrega la pàgina amb l'agent d'usuari del Googlebot (al panell Network conditions de les Chrome DevTools, o amb curl -A "Googlebot" -I [url]).

Els registres del servidor donen el codi d'estat definitiu que el teu servidor ha retornat a Google. Per fer-ho amb moltes URL alhora, SEOcrawl AI et permet filtrar les pàgines rastrejades per codi d'estat de manera massiva.

Автор: David Kaufmann

David Kaufmann

He passat els últims 10+ anys completament obsessionat amb el SEO — i sincerament, no ho canviaria per res.

La meva carrera va fer un salt qualitatiu quan vaig treballar com a especialista SEO sènior a Chess.com — un dels 100 webs més visitats de tot Internet. Operar a aquesta escala em va ensenyar coses que cap curs ni certificació podrien transmetre.

D'aquella experiència vaig fundar SEO Alive — una agència per a marques que es prenen seriosament el creixement orgànic. I com que no trobava cap eina que gestionés bé tant el SEO clàssic com el món de la IA, vaig construir SEOcrawl. Si busques un partner SEO sènior que s'estimi aquest sector de debò — m'encantarà parlar amb tu!

→ Читайте всі статті від David
Més articles de David Kaufmann

Descobreix més contingut d'aquest autor