Thin Content: Cos'è e Come Risolverlo

Nell'articolo di oggi, abbiamo pensato fosse appropriato affrontare il concetto di "thin content" o contenuto scarso/povero perché, in base alla nostra esperienza, abbiamo potuto verificare che è uno di quei concetti che viene molto utilizzato nel nostro settore, ma che molti SEO non sanno esattamente a cosa si riferisca, dato che è molto più ampio di quanto si pensi.
Questo concetto è stato considerato per la prima volta dopo l'aggiornamento Google Panda, il primo grande algoritmo di Google, nel febbraio 2011 (a quei tempi molti di noi non sapevano nemmeno cosa fosse la SEO).
Se vuoi sapere tutto ciò che è importante sul thin content e come lavorarci con quello che consideriamo lo strumento migliore per rilevarlo (SafeCont), ti invitiamo a continuare a leggere questo articolo che abbiamo preparato con grande entusiasmo per i SEO di tutto il mondo.
Cos'è il Thin Content?
Il thin content è il contenuto di una pagina web che fornisce poco o nessun valore all'utente. Questo concetto non comprende solo pagine vuote o semi-vuote come molti pensano.
Tipi di pagine considerate Thin Content
Non esiste un criterio ufficiale che ci dica che una pagina può essere inclusa nel sacco delle "pagine inutili", poiché tutte le pagine possono esserlo (anche la Home page). Tuttavia, con l'esperienza siamo in grado di trovare modelli che ci permettono di sviluppare una classificazione di questo tipo di pagine.
Pagine vuote o semi-vuote
Non solo queste pagine sono povere di contenuto, ma il contenuto non apporta nulla. Dobbiamo ricordare che la lunghezza del contenuto non è un indicatore di thin content o di qualità. Se otteniamo per l'utente tutto ciò che sta cercando con poco contenuto, Google sicuramente lo premierà. La maggior parte di questi casi che un SEO solitamente affronta sono legati a pagine di risultati di ricerca interna che vengono indicizzate, filtri mal lavorati o Tag.

Risultato di ricerca casuale indicizzabile

Pagina TAGS indicizzabile senza contenuto
Per evitare che si verifichi questo tipo di thin content, dovremmo cercare di evitare di rendere indicizzabili questi tipi di pagine, o controllarlo in grande dettaglio. Non dovremmo seguire questa procedura su pagine che possono essere una buona soluzione alla query fatta dagli utenti su Google e che crediamo possano posizionarsi dopo una corretta ottimizzazione.

Esempio di una pagina di risultati di ricerca indicizzata con contenuto appropriato


Pagina TAG indicizzabile con contenuto correlato.
Nel caso dei tag, raccomandiamo anche ciò che è già stato menzionato in molte occasioni: generarli con molta cura e seguendo sempre una significativa strategia SEO. In questo modo ci assicuriamo che possano essere usati come categorizzazione secondaria, proprio come si fa in molti media outlet.
Pagine con contenuto duplicato
Questa è una delle pratiche più combattute da Google: se il contenuto non fornisce informazioni rilevanti e diverse da quelle dei concorrenti, non sarà riconosciuto da Google. Inutile dire che copiare direttamente contenuti da altri portali significa che, nella maggior parte dei casi, sarai severamente penalizzato dai motori di ricerca.
Anche lo spinning di testi è considerato contenuto duplicato, cioè copiarlo e riscriverlo con leggeri adattamenti. Il bot di Google è in grado di rilevare il plagio, anche se alcune frasi vengono cambiate.
Tradurre contenuti da un'altra lingua e includerli direttamente sul tuo sito web è anche considerato thin content.
Il nostro consiglio è di non prendere la via veloce; se vuoi fare buona SEO, lavoraci sodo, genera contenuti interessanti e ti assicuriamo che i risultati arriveranno prima piuttosto che poi.
Contenuto generato automaticamente
In questo caso, ci riferiamo a contenuti generati da strumenti o bot. È vero che l'IA è avanzata molto e che potrebbero essere generati testi relativamente interessanti, ma è ancora una pratica rappresentativa del black hat più basico che il tuo sito web finirà per pagare.
I bot non sono stupidi e nemmeno gli utenti. Generare contenuti che non apportano nulla all'utente è attualmente considerato in SEO Alive come il massimo contraltare della SEO.
Non essere la cavalletta della favola.
Contenuto di affiliazione di bassa qualità
I siti di affiliazione che offrono consigli per l'acquisto e recensioni utili e complete non hanno nulla da temere da Google. Tuttavia, le pagine piene di link di affiliazione che non offrono informazioni utili o rilevanti per l'utente finale sono i principali bersagli di una penalizzazione Google.
Oh, il numero di pagine di questo tipo che hanno ricevuto un disavow negli audit di link building!
Per evitare questo tipo di penalizzazione, dobbiamo assicurarci che il sito web abbia uno scopo oltre l'offerta di affiliazione e fornire opportunità di affiliazione che corrispondano strettamente al settore del tuo sito web.
Doorway Pages
Sono facili da identificare perché sono state progettate principalmente per i motori di ricerca, non per gli umani. Questa tecnica, già in disuso, consiste nel creare diverse pagine/domini con l'obiettivo di posizionarsi per un termine molto specifico o un gruppo molto vicino di termini, e collegarli o reindirizzarli tutti allo stesso URL.
Il contenuto tipico utilizzato su queste pagine è simile a questo:

Esempio di una doorway page.
Dal nostro punto di vista, è una strategia arcaica che nella SEO attuale comporterebbe più sforzo che risultati ed è ovviamente thin content.
Come influisce il thin content su un sito web?
Dobbiamo chiarire che il thin content è solitamente penalizzato su siti web troppo de-ottimizzati, che rappresentano un caos strutturale e di contenuto che nemmeno Google è in grado di identificare, o quelli la cui costruzione ha optato per la via "facile" utilizzando alcune (o molte) tecniche black hat.
Il principale inconveniente di generare thin content su un sito web è che si espone a essere severamente penalizzato da Google, impedendogli di ottenere buoni posizionamenti nelle SERP o causando un calo continuo della sua posizione.
Ma questo non è l'unico inconveniente, dato che se un sito web riesce a ricevere visite da qualsiasi canale, sarà difficile trattenere e convincere gli utenti a interagire. Nella situazione in cui la SEO si trova attualmente, dove l'utente è il protagonista, questo fatto porterà a una maggiore perdita di autorità.
Come rilevare il thin content con Safecont
Dopo tutto quello che già sapevi e dopo aver letto tutto questo, sicuramente non vuoi permettere che il tuo sito web abbia anche un po' di contenuto inutile. Come ti abbiamo appena detto, se hai una strategia di contenuto di qualità e il tuo sito web presenta un livello di ottimizzazione appropriato, non dovresti preoccuparti, ma ti consigliamo di mantenere il controllo di questo tipo di pagine, soprattutto a causa degli utenti che potrebbero atterrarci.
Per questo motivo, pensiamo sia molto appropriato parlare di uno degli strumenti che sta funzionando meglio per noi nella nostra agenzia; vogliamo che tu lo conosca nel caso, come noi, possa esserti utile nei tuoi audit dei contenuti.
Lasciaci dire, per quelli di voi che non lo conoscono, che Safecont è uno strumento spagnolo specializzato in analisi di contenuto e architettura che utilizza la tecnologia Machine Learning per rilevare dove si trovano i principali problemi di un sito web. Con esso possiamo rilevare contenuti di bassa qualità che possono portare a penalizzazioni e altri problemi.
Dato che l'argomento principale dell'articolo è il thin content, ci concentreremo esclusivamente sull'analisi che lo strumento esegue di esso. Una volta scansionato il sito web, in prima istanza, nel riepilogo della scansione troviamo già il numero di URL che presentano questo problema.

Vista generale della dashboard dello strumento SEO Safecont.
Se approfondiamo l'analisi specifica…

La funzione di rilevamento del thin content è una delle migliori funzionalità dello strumento.
Troviamo un riepilogo molto visivo e molto accurato dello stato del sito web.

Vista generale dell'analisi cluster di SafeCont.
La prima cosa che catturerà la nostra attenzione, senza dubbio, è il peculiare grafico a forma di rinoceronte (il logo dello strumento, dato che un panda sarebbe stato troppo ovvio) che ci mostra la percentuale di rischio di subire una penalizzazione.

Grafico del rischio di penalizzazione di Safecont.
Secondo questa analisi, il sito web soddisfa il livello ottimale di thin content e, per il momento, Google non ha motivo di penalizzarli. Sotto questa analisi vediamo una tabella e un grafico molto curiosi e rappresentativi che ci permettono di ottenere una vista generale dello stato del sito web:

Analisi del thin content attraverso cluster.
La tabella ci mostra tre colonne:
- Link: che fornisce, in intervalli di 10, la percentuale di thin content che le pagine possono avere.
- Pagine: il numero di pagine che presentano ciascuna percentuale di thin content.
- Cluster Risk: la probabilità che ciascuna delle pagine all'interno di ciascun intervallo venga penalizzata.
Sappiamo che espresso così può sembrare un po' confuso, ma il modo corretto di interpretarlo sarebbe qualcosa di simile a questo: "Osserviamo che la maggior parte delle pagine (706) presenta una percentuale di thin content tra il 10 e il 20%, con una probabilità media di essere penalizzate del 29,81%.
Solo quattro pagine hanno una percentuale di thin content maggiore del 40% e la probabilità di essere penalizzate è del 36,98%."
Il grafico rappresenta questo, differenziando ciascun intervallo per colori, con il verde che è quello con la percentuale più bassa di thin content e il rosso quello con la più alta. Ecco perché il secondo intervallo (10%-20%) è rappresentato con il maggior spessore.
E infine…

Analisi individuale dell'URL (thin content, rischio di penalizzazione...)
…Safecont ci mostra un'analisi individuale di ciascun URL permettendoci di filtrare a piacere. Insieme agli URL, appaiono 3 dati:
- ThinRatio: percentuale di parole simili all'interno della stessa pagina
- NUMWORDS: densità di parole incluse nel contenuto
- PAGERISK: probabilità che la pagina possa essere penalizzata.
Come abbiamo detto durante tutto l'articolo, non possiamo concentrarci esclusivamente sulla lunghezza del contenuto, come fa lo strumento in quest'ultima parte. Tuttavia, è qualcosa che dobbiamo tenere a mente.
Questo strumento deve essere compreso globalmente, dato che ci permetterà di effettuare audit dei contenuti di altissima qualità. Ti raccomandiamo vivamente di provarlo.
** Nota: Questo articolo non è stato sponsorizzato, ma crediamo veramente che Safecont fornisca valore e sia di grande qualità, e quindi consideriamo appropriato condividerlo con la comunità SEO.*
Autore: David Kaufmann

Ho passato gli ultimi oltre 10 anni completamente ossessionato dal SEO — e onestamente, non vorrei fosse altrimenti.
La mia carriera ha fatto un salto di qualità quando ho lavorato come Senior SEO Specialist per Chess.com — uno dei 100 siti più visitati dell'intero Internet. Operare a quella scala, su milioni di pagine, decine di lingue e in una delle SERPs più competitive in assoluto, mi ha insegnato cose che nessun corso o certificazione avrebbe mai potuto. Quell'esperienza ha cambiato la mia prospettiva su come dovrebbe essere davvero un grande SEO — ed è diventata la base di tutto ciò che ho costruito da allora.
Da quell'esperienza è nata SEO Alive — un'agenzia per brand che fanno sul serio con la crescita organica. Non siamo qui per vendere dashboards e report mensili. Siamo qui per costruire strategie che spostino davvero l'ago della bilancia, combinando il meglio del SEO classico con l'entusiasmante nuovo mondo della Generative Engine Optimization (GEO) — facendo in modo che il tuo brand appaia non solo nei link blu di Google, ma anche all'interno delle risposte generate dall'AI che ChatGPT, Perplexity e Google AI Overviews consegnano ogni giorno a milioni di persone.
E poiché non riuscivo a trovare uno strumento che gestisse correttamente entrambi questi mondi, me ne sono costruito uno — SEOcrawl, una piattaforma enterprise di SEO intelligence che unisce rankings, audit tecnici, monitoraggio dei backlinks, salute del crawl e tracciamento della visibilità del brand nell'AI, tutto in un unico posto. È la piattaforma che ho sempre desiderato esistesse.
Scopri altri contenuti di questo autore

