Pàgines òrfenes: què són i com trobar-les

Perquè una pàgina web funcioni i pugui mostrar les pàgines que conté perquè els usuaris les puguin veure, ha de tenir una estructura d'enllaçat adequada que ajudi, en primer lloc, els usuaris a arribar a aquestes pàgines amb un sol clic, i també asseguri que siguin rastrejades pels bots i aranyes de Google perquè apareguin als resultats de cerca. Quan una pàgina no està integrada a l'estructura d'enllaços, s'anomena "pàgina òrfena".
Però, què és exactament una pàgina òrfena? Tractarem aquest terme amb detall, juntament amb les conseqüències que pot tenir des d'una perspectiva SEO, per què passa, com trobar aquest tipus de pàgines i com solucionar els problemes que poden causar. Anem-hi!
Què són les pàgines òrfenes?
Concretament, una pàgina òrfena és una pàgina d'una pàgina web que, tot i que pot estar o no indexada per Google o un altre cercador, no es connecta o enllaça amb l'estructura de pàgines de la plataforma, quedant completament aïllada.
D'aquesta manera, aquesta pàgina és com si "flotés" al lloc sense ser accessible pels usuaris que la podrien visitar, ni pels bots de Google per ser mostrada en un resultat de cerca, encara que estigui indexada. Encara que una pàgina estigui representada al sitemap XML amb la seva URL corresponent, no hi ha cap garantia que no existeixin pàgines òrfenes, perquè per qualsevol motiu o error humà, no es pot arribar fins a ella ni l'usuari ni els rastrejadors dels cercadors.

Per exemple, hi ha dues maneres en què es descobreixen les pàgines d'una pàgina web:
-
mitjançant el rastrejador que troba totes les pàgines seguint els enllaços entre elles, i
-
mitjançant la llista d'URLs al sitemap XML.
Quan existeix una pàgina òrfena aïllada, és com si fos invisible, encara que estigui al sitemap, perquè com que no té enllaços que hi apuntin, no es troba.
Això comporta una sèrie de problemes pel que fa a:
-
trànsit
-
pèrdua de potencial
-
problemes SEO
-
visibilitat
-
autoritat, i
-
possibles penalitzacions
...entre d'altres que comentarem amb detall més endavant. De moment, el que està clar és que les possibles pàgines òrfenes, per molt gran o petit que sigui un lloc, s'han de corregir, cosa que és possible i és una pràctica de manteniment habitual.
Per què passa que una pàgina web té pàgines òrfenes?
Hi ha diverses raons per les quals una pàgina web té pàgines òrfenes, fins i tot sense que el propietari o desenvolupador en sigui conscient o ho sàpiga en algun moment. Freqüentment, aquests tipus de pàgines, indesitjables en una plataforma web, es deuen a canvis fets de mala manera, normalment causats per error humà.
A continuació, mostrem els principals escenaris en què es generen o es causen pàgines òrfenes en una pàgina web:
-
De vegades, es canvia l'enllaçat intern de les pàgines d'una pàgina web, cosa que provoca que algunes URLs siguin eliminades perquè ja no són necessàries, són antigues, o per optimització del lloc. Moltes vegades, fins i tot quan s'eliminen els enllaços, les pàgines romanen al lloc flotant sense ser eliminades del tot.
-
Pàgines de tests A/B amb les quals l'usuari final no entra en contacte i que, després de ser utilitzades en el desenvolupament del lloc, romanen allà sense ser eliminades.
-
Quan es genera una landing page temporalment per atreure usuaris perquè es facin clients d'un lloc, com en períodes promocionals, Nadal o altres, i després d'aquell temps la pàgina s'esborra, però l'URL indexada hi roman.
-
Quan es treu una categoria del menú del lloc, però no es redirecciona correctament a una altra creada al seu lloc, deixant la pàgina restant sense enllaços a la plataforma.
-
Durant una migració de lloc, sovint es generen nombroses pàgines òrfenes que canvien de format, URL i paràmetres, però no s'eliminen i acaben desconnectades i aïllades del lloc.
-
Quan s'utilitza una plantilla per construir una pàgina web, i queden pàgines per defecte de la plantilla que després s'obliden i no s'eliminen.
D'altra banda, hi ha dues causes habituals de pàgines òrfenes que cal abordar i tractar immediatament; són essencialment pàgines duplicades que haurien de redirigir consistentment de manera automàtica a una sola URL. Concretament, parlem de l'ús consistent d'HTTPS i HTTP a pàgines canòniques i no canòniques, així com de l'ús de barres finals (trailing slashes).
D'una altra manera, és probable que algunes versions de la pàgina no estiguin enllaçades i, com a resultat, es tornin òrfenes. En aquest cas, el fet que siguin òrfenes no és el problema principal sinó el fet que siguin duplicades i causaran problemes de penalització o pèrdua d'indexació, entre d'altres, que es tradueixen a Google com a contingut copiat o de baixa qualitat. Tractarem això més endavant a la secció de solució de pàgines òrfenes.
Les pàgines òrfenes beneficien o perjudiquen el SEO?
Les pàgines òrfenes representen un problema des del punt de vista SEO, així com per a la visibilitat, l'autoritat, la pèrdua de contingut i el trànsit, segons la quantitat que n'hi hagi en una plataforma. És a dir, que una plataforma tingui una, dues o unes quantes pàgines òrfenes podria no causar cap problema, però quan formen un percentatge gran del lloc, és quan comencen els problemes.
Optimitzar un lloc perquè no tingui cap pàgina òrfena és important per al SEO i en altres aspectes, i mai es podria dir que beneficien el lloc; més aviat el perjudiquen quan n'hi ha massa.
En primer lloc, els cercadors no poden trobar les pàgines òrfenes a través d'enllaços, així que les pàgines òrfenes sovint no s'indexen i mai apareixen als resultats de cerca, afectant el seu trànsit, visibilitat i potencial, però ho tractarem amb més detall més endavant en una secció pròpia.
Problemes generals causats per les pàgines òrfenes
A continuació hi ha alguns problemes generals causats per les pàgines òrfenes, especialment quan cobreixen una part important de l'estructura d'enllaços i URLs del lloc:
-
Experiència d'usuari: les pàgines òrfenes, per improbable que sembli, afecten enormement l'experiència d'usuari d'un lloc, ja que els usuaris no poden visitar de manera natural una pàgina mitjançant un menú o un enllaç d'interès que els porti al que busquen, encara que la pàgina existeixi i tingui contingut de qualitat.
-
Autoritat: si pàgines importants es tornen òrfenes i perden el seu enllaçat amb les altres URLs del lloc, tota l'autoritat que poguessin tenir es malbarata, i això afecta directament el posicionament als resultats de cerca de Google, ja que és un factor SEO important en la manera com el cercador ordena els resultats per a una paraula clau específica.
-
Context: l'enllaçat intern d'un lloc dona context als rastrejadors de Google per saber com indexar la pàgina i per a quines cerques és important i rellevant. Les pàgines òrfenes fan que el lloc i les pròpies pàgines perdin context i sentit semàntic, en cas que estiguin indexades.
Tanmateix, quan les pàgines òrfenes hi són en grans quantitats, el seu impacte és molt més notable a l'hora de posicionar, generar trànsit i ser rastrejades, així que aquests són problemes que cal tractar per separat i de manera més extensa.
Problema de pàgina amb baixa visibilitat i trànsit
Les pàgines òrfenes tenen una influència negativa notable quan es tracta directament del posicionament del lloc i de la pàgina específica afectada, així com del seu trànsit. I això és perquè, com s'ha esmentat abans, una pàgina òrfena està aïllada i es torna invisible, tant per a l'usuari que no la pot trobar de manera natural al lloc mitjançant un botó o un clic, com també per als rastrejadors de Google o d'altres cercadors.
Això clarament afecta el trànsit del lloc i de la pàgina, així com la seva visibilitat, en no rebre molts usuaris i també a causa del lloc pobre o inexistent que les pàgines òrfenes tenen als resultats de cerca. Com a conseqüència, hi ha una pèrdua total de potencial per al lloc i per a la pàgina, especialment si inclou contingut de qualitat sobre productes, serveis i altres temes. L'impacte sobre el trànsit i la visibilitat també resulta en una pèrdua d'autoritat i rellevància per a un lloc respecte al seu nínxol o indústria en comparació amb la competència.
Problema de pèrdua de rastreig
Google com a cercador indexa les pàgines d'un lloc segons el que es coneix com a pressupost de rastreig o Crawl Budget, que es pot descriure com el temps que els rastrejadors o aranyes del cercador dedicaran a trobar pàgines per indexar. Com més pàgines tingui un lloc, més temps requerirà, és a dir, més pressupost de rastreig.
Aquí és on entra en joc l'optimització de l'estructura, l'arquitectura i altres elements de la pàgina web, com les pàgines òrfenes. Si un lloc té pàgines òrfenes irrellevants, igualment consumirà pressupost de rastreig, que es malbarata i podria fer que pàgines amb bona salut i contingut no s'indexessin, afectant els resultats de cerca i el trànsit. En resum, les pàgines òrfenes representen un malbaratament de recursos que Google no està disposat a gastar.
Diferència entre pàgines òrfenes i pàgines Dead End
Pel que fa al SEO, el terme pàgina òrfena pot confondre's amb el terme pàgina sense sortida o "Dead End", perquè representen problemes similars, però no són el mateix. Ja hem definit abans què són les pàgines òrfenes, passem als dead ends:
Una pàgina dead end és una pàgina que no està enllaçada amb cap altra de l'enllaçat intern del lloc, ni amb cap altra plataforma web externa, és a dir, un cop hi arribes, no pots fer res excepte tancar-la i marxar.
Quan els rastrejadors d'un cercador com Google cauen en una pàgina dead end, no tenen cap lloc on anar, i d'aquí ve el seu nom, que fa una analogia amb un carrer sense sortida.
Com trobar pàgines òrfenes al teu lloc?
Per començar a resoldre les qüestions relacionades amb les pàgines òrfenes o Orphan Pages, el primer que hem de fer és trobar-les, ja que òbviament no es mostren a primera vista ni com a usuari del lloc ni com a desenvolupador. Per sort, es poden utilitzar diferents eines com el software SEO que analitzen tota la nostra estructura web amb detall, obtenint a través dels logs del servidor la imatge completa de totes elles.
Si necessites un potent Software SEO que t'ajudi no només a localitzar pàgines òrfenes sinó també a impulsar i millorar la teva estratègia SEO, no dubtis a fer una ullada al programa desenvolupat internament per SEO Alive!
Reconeixent pàgines òrfenes amb Screaming Frog
Com hem comentat, hi ha diversos programes al mercat que t'ajuden a identificar aquestes pàgines òrfenes; ens centrarem a explicar de manera senzilla com fer-ho amb un dels més coneguts, Screaming Frog.
Screaming Frog té dos programes diferents, el més conegut per tothom, que rastreja tota la pàgina web seguint els enllaços interns que troba, i el log analyser, que analitza els registres d'accés del servidor, és a dir, els registres que queden quan Googlebot (o un altre user agent) entra a visitar qualsevol de les nostres pàgines.
Amb el primer, n'extraurem un fitxer que llista les URLs totals que el rastrejador troba en navegar; serà un fitxer Excel que podem trobar a la secció d'informes a "all inlinks":

Bé, un cop tenim aquest fitxer, agafem els logs del nostre servidor, que normalment serà un fitxer comprimit dels esmentats registres, i els carreguem al log analyser de Screaming Frog, de manera que aquí tindrem un panell on apareixeran totes les URLs que Googlebot ha visitat durant el període de temps que carreguem, estiguin enllaçades o no.
L'últim pas serà carregar el fitxer Excel del pas anterior a la secció habilitada del log analyser per a aquest propòsit, i s'habilitarà una nova pestanya quan ho fem amb les opcions següents:

-
Matched with URL data: Aquest serà el conjunt d'URLs que estan enllaçades internament i han estat visitades per Google.
-
Not in log file: Aquelles URLs que estan enllaçades però per algun motiu no estan rebent esdeveniments (visites) de Google.
-
Not in URL data: Aquest és el grup que ens interessa en aquest cas; són URLs que Google està visitant, deixant un registre als logs, però que el rastrejador no ha pogut trobar quan ha fet la simulació, perquè no estan enllaçades internament, és a dir, són les nostres buscades pàgines òrfenes.
D'aquest tercer grup, n'extraurem la llista de pàgines que catalogarem com a òrfenes, sent les que retornen un codi d'estat 200 fonamentalment l'objecte de la nostra optimització.
Com solucionar el problema de les pàgines òrfenes?
En general i de manera manual, hi ha quatre coses que es poden fer si tens URLs que no estan integrades a l'enllaçat intern, on cal prendre algunes decisions:
-
En primer lloc, si després d'una migració hi ha pàgines òrfenes, com probablement hi haurà, i es revisen i moltes d'elles tenen poc contingut rellevant, no en tenen, o en tenen de duplicat, el millor és eliminar-les i, quan correspongui, afegir una redirecció 301 a pàgines similars o destacades del lloc amb més autoritat.
-
En segon lloc, si per algun motiu vols mantenir una pàgina òrfena per bon contingut, autoritat i trànsit, el següent pas és enllaçar-la des d'una URL del lloc que tingui contingut relacionat, i que sigui fàcil d'arribar pels usuaris i per Google. Per descomptat, cal destacar que la URL de la pàgina ha d'estar inclosa al sitemap.
-
En tercer lloc, si apareixen nombroses pàgines òrfenes però la seva naturalesa és temporal i el seu contingut ja ha caducat perquè incloïa promocions i continguts relacionats amb un moment específic, fem el mateix que al pas anterior i enllacem la pàgina a una altra interna amb rellevància i que sigui accessible. No obstant això, en aquest cas fem que aquesta URL no s'indexi incloent una meta tag "noindex" perquè no la tinguin en compte els rastrejadors.
-
Finalment, en el cas de pàgines òrfenes amb contingut duplicat o gairebé duplicat, valdria la pena considerar eliminar aquesta pàgina i incloure'n el contingut en una altra per no perdre'l i continuar aprofitant-ne el potencial general.
Conclusió
Les pàgines òrfenes són un element natural que apareixerà a una pàgina web per diversos motius, i quan no són excessives o la seva quantitat no creix exponencialment, no representen cap problema.
D'altra banda, quan un percentatge gran d'una pàgina web i del seu enllaçat intern està format per pàgines d'aquest tipus, pot generar molts problemes pel que fa al rastreig, posicionament i trànsit relacionats amb el SEO, així com a l'autoritat, l'experiència d'usuari i altres qüestions que cal abordar.
La bona notícia és que les pàgines òrfenes es poden solucionar de diverses maneres, però sempre en un procés d'anàlisi, el que t'has de preguntar és si cada pàgina òrfena específica és rellevant per al posicionament, per al contingut i pot ser enllaçada amb una altra, i quan no és el cas, simplement esborrar-les.
I tu, estimada lectora o lector... coneixies l'existència de les pàgines òrfenes? T'has trobat aquest element en algun dels teus projectes o dels teus clients? Deixa'ns un comentari i et respondrem. Moltes gràcies i fins la propera!
Автор: David Kaufmann

He passat els últims 10+ anys completament obsessionat amb el SEO — i sincerament, no ho canviaria per res.
La meva carrera va fer un salt qualitatiu quan vaig treballar com a especialista SEO sènior a Chess.com — un dels 100 webs més visitats de tot Internet. Operar a aquesta escala em va ensenyar coses que cap curs ni certificació podrien transmetre.
D'aquella experiència vaig fundar SEO Alive — una agència per a marques que es prenen seriosament el creixement orgànic. I com que no trobava cap eina que gestionés bé tant el SEO clàssic com el món de la IA, vaig construir SEOcrawl. Si busques un partner SEO sènior que s'estimi aquest sector de debò — m'encantarà parlar amb tu!
Дізнайтесь більше контенту цього автора

