Pagine orfane: cosa sono e come trovarle

Pagine orfane: cosa sono e come trovarle
David Kaufmann
Tutorial SEO
13 min read

Affinché un sito funzioni e possa mostrare le pagine che contiene affinché gli utenti possano visualizzarle, deve avere una corretta struttura di linking che aiuti, prima di tutto, gli utenti a raggiungere quelle pagine con un solo click, e che assicuri anche che vengano scansionate dai bot e dagli spider di Google in modo che appaiano nei risultati di ricerca. Quando una pagina non è integrata nella struttura di link, viene chiamata "pagina orfana".

Ma, cos'è esattamente una pagina orfana? Affronteremo questo termine in dettaglio, insieme alle conseguenze che può avere dal punto di vista SEO, perché succede, come trovare questo tipo di pagine e come risolvere i problemi che possono causare. Mettiamoci all'opera!

Cosa sono le pagine orfane?

Nello specifico, una pagina orfana è una pagina di un sito che, anche se può o meno essere indicizzata da Google o da un altro motore di ricerca, non si connette o linka alla struttura di pagina della piattaforma, diventando completamente isolata.

In questo modo, quella pagina è come se "fluttuasse" sul sito senza essere raggiungibile dagli utenti che potrebbero visitarla, o dai bot di Google per essere mostrata in un risultato di ricerca, anche se è indicizzata. Anche se una pagina è rappresentata nella sitemap XML con il suo URL corrispondente, non c'è garanzia che non esistano pagine orfane, perché per qualunque motivo o errore umano, non può essere raggiunta dall'utente o dai crawler dei motori di ricerca.

cosa sono le pagine orfane
cosa sono le pagine orfane

Per esempio, ci sono due modi in cui le pagine di un sito vengono scoperte:

  • attraverso il crawler che trova tutte le pagine seguendo i link tra di esse, e

  • attraverso l'elenco di URL nella sitemap XML.

Quando esiste una pagina orfana isolata, è come se fosse invisibile, anche se si trova nella sitemap, perché non avendo link che puntano ad essa, non viene trovata.

Questo provoca una serie di problemi riguardanti:

  • traffico

  • perdita di potenziale

  • problemi SEO

  • visibilità

  • autorità, e

  • possibili penalizzazioni

...tra gli altri di cui discuteremo in dettaglio più avanti. Per ora, ciò che è chiaro è che le potenziali pagine orfane, non importa quanto grande o piccolo sia un sito, devono essere corrette, il che è possibile ed è una pratica comune di manutenzione.

Perché succede che un sito abbia pagine orfane?

Ci sono diverse ragioni per cui un sito ha pagine orfane, anche senza che il proprietario o lo sviluppatore ne sia a conoscenza o lo sappia in qualche momento. Frequentemente, questi tipi di pagine, indesiderabili su una piattaforma web, sono dovuti a cambiamenti fatti in modo scorretto, che è solitamente causato da errore umano.

Di seguito, mostriamo i principali scenari in cui le pagine orfane vengono generate o causate su un sito:

  • A volte, il linking interno delle pagine di un sito viene cambiato, il che fa sì che alcuni URL vengano rimossi perché non sono più necessari, sono vecchi o per ottimizzazione del sito. Molte volte, anche quando i link vengono rimossi, le pagine restano sul sito fluttuando senza essere completamente rimosse.

  • Pagine di test A/B con cui l'utente finale non viene a contatto, che, dopo essere state usate nello sviluppo del sito, restano lì senza essere rimosse.

  • Quando una landing page viene generata temporaneamente per attirare utenti a diventare clienti di un sito, ad esempio durante periodi promozionali, Natale o altri, e dopo che quel tempo è passato la pagina viene cancellata, ma l'URL indicizzato rimane.

  • Quando una categoria viene rimossa dal menu del sito, ma non viene reindirizzata correttamente a un'altra creata al suo posto, lasciando la pagina rimanente senza link sulla piattaforma.

  • Durante una migrazione di sito, vengono spesso generate numerose pagine orfane che cambiano formato, URL e parametri, ma non vengono rimosse e diventano disconnesse e isolate dal sito.

  • Quando un template viene usato per costruire un sito, e vengono lasciate pagine di template di default che vengono poi dimenticate e non rimosse.

D'altra parte, ci sono due cause comuni di pagine orfane che devono essere affrontate e gestite immediatamente; queste sono essenzialmente pagine duplicate che dovrebbero coerentemente reindirizzare automaticamente a un singolo URL. Nello specifico, parliamo dell'uso coerente di HTTPS e HTTP su pagine canoniche e non canoniche, oltre all'uso degli slash finali.

Altrimenti, è probabile che alcune versioni della pagina non siano linkate e, di conseguenza, diventino orfane. In questo caso, il fatto che siano orfane non è il problema principale ma piuttosto il fatto che siano duplicati e causeranno problemi di penalizzazione o perdita di indicizzazione, tra gli altri, che si traducono in Google come contenuto copiato o di bassa qualità. Affronteremo questo più tardi nella sezione sulla risoluzione delle pagine orfane.

Le pagine orfane giovano o danneggiano la SEO?

Le pagine orfane rappresentano un problema dal punto di vista SEO, oltre che per visibilità, autorità, perdita di contenuti e traffico, a seconda della quantità di esse esistente su una piattaforma. Cioè, una piattaforma che ha una, due o poche pagine orfane potrebbe non causare alcun problema, ma quando costituiscono una grande percentuale del sito, è lì che iniziano i problemi.

Ottimizzare un sito affinché non abbia pagine orfane è importante per la SEO e in altri aspetti, e non si potrebbe mai dire che giovino al sito; piuttosto, lo danneggiano quando ce ne sono troppe.

Innanzitutto, i motori di ricerca non possono trovare le pagine orfane attraverso i link, quindi le pagine orfane spesso non vengono indicizzate e non appaiono mai nei risultati di ricerca, influenzando il loro traffico, visibilità e potenziale, ma affronteremo questo in maggior dettaglio più avanti nella sua sezione.

Problemi generali causati dalle pagine orfane

Di seguito sono riportati alcuni problemi generali causati dalle pagine orfane, specialmente quando coprono una parte significativa della struttura di link e degli URL del sito:

  • User experience: le pagine orfane, per quanto improbabile possa sembrare, influenzano notevolmente la user experience di un sito, dato che gli utenti non possono naturalmente visitare una pagina attraverso un menu o un link di interesse che li porti a ciò che cercano, anche se la pagina esiste e ha contenuto di qualità.

  • Autorità: se pagine importanti diventano orfane e perdono il loro linking agli altri URL del sito, tutta l'autorità che potrebbero avere viene sprecata, e questo influisce direttamente sul ranking nei risultati di ricerca di Google, dato che è un importante fattore SEO nel modo in cui il motore di ricerca ordina i risultati per una keyword specifica.

  • Contesto: il linking interno di un sito dà contesto ai crawler di Google per sapere come indicizzare la pagina e per quali ricerche è importante e rilevante. Le pagine orfane fanno sì che il sito e le pagine stesse perdano contesto e significato semantico, nel caso siano indicizzate.

Tuttavia, quando le pagine orfane sono presenti in grandi quantità, il loro impatto è molto più evidente quando si tratta di ranking, traffico e crawling, quindi questi sono problemi che devono essere affrontati separatamente e più estesamente.

Problema della pagina con bassa visibilità e traffico

Le pagine orfane hanno una notevole influenza negativa quando si tratta direttamente del ranking o posizionamento del sito e della pagina specifica colpita, oltre al suo traffico. E questo perché, come menzionato prima, una pagina orfana è isolata e diventa invisibile, sia per l'utente che non può naturalmente trovarla sul sito tramite un pulsante o un click, sia per i crawler di Google o di altri motori di ricerca.

Questo chiaramente influisce sul traffico del sito e della pagina, oltre che sulla sua visibilità, non ricevendo molti utenti e anche a causa della scarsa o inesistente posizione che le pagine orfane hanno nei risultati di ricerca. Di conseguenza, si ha a che fare con una totale perdita di potenziale per il sito e la pagina, specialmente se include contenuto di qualità su prodotti, servizi e altri argomenti. L'impatto su traffico e visibilità si traduce anche in una perdita di autorità e rilevanza per un sito rispetto alla sua nicchia o industria rispetto ai concorrenti.

Problema di perdita di crawling

Google come motore di ricerca indicizza le pagine di un sito secondo quello che è noto come crawl budget o Crawl Budget, che può essere descritto come il tempo che i crawler o spider del motore di ricerca trascorreranno trovando pagine da indicizzare. Più pagine ha un sito, più tempo richiederà, cioè, più crawl budget.

È qui che entra in gioco l'ottimizzazione della struttura, architettura e altri elementi del sito, come le pagine orfane. Se un sito ha pagine orfane irrilevanti, consumerà ugualmente il crawl budget, che viene sprecato e potrebbe far sì che le pagine con buona salute e contenuto non vengano indicizzate, influenzando i risultati di ricerca e il traffico. In breve, le pagine orfane rappresentano uno spreco di risorse che Google non è disposto a spendere.

Differenza tra pagine orfane e pagine Dead End

Quando si tratta di SEO, il termine pagina orfana** può essere confuso con il termine pagina dead end o "Dead End"**, perché rappresentano problemi simili, ma non sono la stessa cosa. Abbiamo già definito in precedenza cosa sono le Pagine Orfane, andiamo avanti con i dead end:

Una pagina dead end è una pagina che non è linkata a nessun'altra dal linking interno del sito, né a nessun'altra piattaforma web esterna, cioè, una volta che ci atterri, non puoi fare nulla se non chiuderla e andartene.

Quando i crawler di un motore di ricerca come Google cadono su una pagina dead end, non hanno dove andare, e da lì viene il suo nome, che traccia un'analogia con una strada senza uscita.

Come trovare le pagine orfane sul tuo sito?

Per iniziare a risolvere i problemi relativi alle pagine orfane o Orphan Pages, la prima cosa che dobbiamo fare è trovarle, dato che ovviamente non vengono mostrate a prima vista né come utente del sito né come sviluppatore. Fortunatamente, possono essere usati diversi strumenti come software SEO che analizzano in dettaglio l'intera struttura del nostro sito, ottenendo attraverso i log del server l'immagine completa di tutte loro.

Se hai bisogno di un potente Software SEO che ti aiuti non solo a localizzare le pagine orfane ma anche a potenziare e migliorare la tua strategia SEO, non esitare a dare un'occhiata al programma sviluppato internamente da SEO Alive!

Riconoscere le pagine orfane con Screaming Frog

Come abbiamo menzionato, ci sono diversi programmi sul mercato che ti aiutano a identificare queste pagine orfane; ci concentreremo sullo spiegare in modo semplice come farlo con uno dei più conosciuti, Screaming Frog.

Screaming Frog ha due programmi diversi, quello più conosciuto da tutti, che scansiona l'intero sito seguendo i link interni che trova, e il log analyser, che analizza i log di accesso del server, ovvero i record che rimangono quando Googlebot (o un altro user agent) entra a visitare una qualsiasi delle nostre pagine.

Con il primo, andremo a estrarre un file che elenca gli URL totali che il crawler trova durante la navigazione; sarà un file Excel che possiamo trovare nella sezione report sotto "all inlinks":

come trovare pagine orfane
come trovare pagine orfane

Bene, una volta che abbiamo questo file, prendiamo i log dal nostro server, che normalmente saranno un file compresso dei suddetti record, e lo carichiamo nel log analyser di Screaming Frog, in modo che qui avremo un pannello dove appariranno tutti gli URL che Googlebot ha visitato durante il periodo di tempo che carichiamo, che siano linkati o meno.

L'ultimo passo sarà caricare il file Excel del passo precedente nella sezione abilitata del log analyser per quello scopo, e una nuova scheda verrà abilitata quando lo facciamo con le seguenti opzioni:

pagine orfane log analyser
pagine orfane log analyser

  • Matched with URL data: Questo sarà l'insieme di URL che sono linkati internamente e sono stati visitati da Google.

  • Not in log file: Quegli URL che sono linkati ma per qualche motivo non stanno ricevendo eventi (visite) da Google.

  • Not in URL data: Questo è il gruppo che ci interessa in questo caso; questi sono URL che Google sta visitando, lasciando un record nei log, ma che il crawler non è stato in grado di trovare facendo la simulazione, perché non sono linkati internamente, cioè, sono le nostre tanto cercate Pagine Orfane.

Da questo terzo gruppo, estrarremo l'elenco delle pagine che cataloghiamo come orfane, con quelle che restituiscono un codice di stato 200 fondamentalmente come oggetto della nostra ottimizzazione.

Come risolvere il problema delle pagine orfane?

In generale e manualmente, ci sono quattro cose che si possono fare se hai URL che non sono integrati nel linking interno, dove devono essere prese alcune decisioni:

  • Innanzitutto, se dopo una migrazione ci sono pagine orfane, come probabilmente ci saranno, e vengono riviste e molte di esse hanno contenuto poco rilevante, nessuno o duplicato, la cosa migliore da fare è cancellarle e, dove appropriato, aggiungere un redirect 301 a pagine simili o in evidenza sul sito con più autorità.

  • In secondo luogo, se per qualche motivo vuoi mantenere una pagina orfana per buon contenuto, autorità e traffico, il passo successivo è linkarla da un URL del sito che abbia contenuto correlato, e che sia facile da raggiungere dagli utenti e da Google. Naturalmente, va notato che l'URL della pagina deve essere incluso nella sitemap.

  • In terzo luogo, se appaiono numerose pagine orfane ma la loro natura è temporanea e il loro contenuto è già scaduto perché includeva promozioni e contenuti relativi a un momento specifico, facciamo lo stesso del passo precedente e linkiamo la pagina a un'altra interna con rilevanza e che sia accessibile. Tuttavia, in questo caso facciamo in modo che quell'URL non sia indicizzato includendo un meta tag "noindex" in modo che non venga preso in considerazione dai crawler.

  • Infine, nel caso di pagine orfane con contenuto duplicato o quasi duplicato, varrebbe la pena considerare di cancellare quella pagina e includere il contenuto in un'altra per non perderlo e continuare a sfruttare il suo potenziale generale.

Conclusione

Le pagine orfane sono un elemento naturale che apparirà su un sito per varie ragioni, e quando non sono eccessive o la loro quantità non cresce esponenzialmente, non rappresentano alcun problema.

D'altra parte, quando una grande percentuale di un sito e del suo linking interno è composta da pagine di questo tipo, può generare molti problemi riguardanti crawling, ranking e traffico relativi alla SEO, oltre ad autorità, user experience e altre questioni che devono essere affrontate.

La buona notizia è che le pagine orfane possono essere risolte in diversi modi, ma sempre in un processo di analisi, ciò che devi chiederti è se ogni specifica pagina orfana sia rilevante per il ranking, per il contenuto, e possa essere linkata a un'altra, e quando non è il caso, semplicemente cancellarle.

E tu, caro lettore... conoscevi l'esistenza delle pagine orfane? Ti sei imbattuto in questo elemento in qualche tuo progetto o in quelli dei tuoi clienti? Lasciaci un commento e ti risponderemo. Grazie mille e alla prossima!

Autore: David Kaufmann

David Kaufmann

Ho passato gli ultimi oltre 10 anni completamente ossessionato dal SEO — e onestamente, non vorrei fosse altrimenti.

La mia carriera ha fatto un salto di qualità quando ho lavorato come Senior SEO Specialist per Chess.com — uno dei 100 siti più visitati dell'intero Internet. Operare a quella scala, su milioni di pagine, decine di lingue e in una delle SERPs più competitive in assoluto, mi ha insegnato cose che nessun corso o certificazione avrebbe mai potuto. Quell'esperienza ha cambiato la mia prospettiva su come dovrebbe essere davvero un grande SEO — ed è diventata la base di tutto ciò che ho costruito da allora.

Da quell'esperienza è nata SEO Alive — un'agenzia per brand che fanno sul serio con la crescita organica. Non siamo qui per vendere dashboards e report mensili. Siamo qui per costruire strategie che spostino davvero l'ago della bilancia, combinando il meglio del SEO classico con l'entusiasmante nuovo mondo della Generative Engine Optimization (GEO) — facendo in modo che il tuo brand appaia non solo nei link blu di Google, ma anche all'interno delle risposte generate dall'AI che ChatGPT, Perplexity e Google AI Overviews consegnano ogni giorno a milioni di persone.

E poiché non riuscivo a trovare uno strumento che gestisse correttamente entrambi questi mondi, me ne sono costruito uno — SEOcrawl, una piattaforma enterprise di SEO intelligence che unisce rankings, audit tecnici, monitoraggio dei backlinks, salute del crawl e tracciamento della visibilità del brand nell'AI, tutto in un unico posto. È la piattaforma che ho sempre desiderato esistesse.

→ Leggi tutti gli articoli di David
Altri articoli di David Kaufmann

Scopri altri contenuti di questo autore