Thin Content: què és i com solucionar-lo

Thin Content: què és i com solucionar-lo
David Kaufmann
Tutorials SEO
9 min read

A l'article d'avui, hem pensat que seria adequat tractar el concepte de "thin content" o contingut escàs/pobre perquè, segons la nostra experiència, hem pogut comprovar que és un d'aquests conceptes que s'utilitza molt al nostre sector, però que molts SEO no saben exactament a què es refereix, ja que és molt més ampli del que la gent pensa.

Aquest concepte es va començar a considerar després de l'actualització Google Panda, el primer gran algoritme de Google, al febrer del 2011 (en aquella època molts ni tan sols sabíem què era el SEO).

Si vols saber tot el que és important sobre el thin content i com treballar-lo amb el que considerem la millor eina per detectar-lo (SafeCont), t'invitem a continuar llegint aquest article que hem preparat amb gran il·lusió per als SEO d'arreu del món.

Què és el Thin Content?

El thin content és el contingut d'una pàgina web que aporta poc o cap valor a l'usuari. Aquest concepte no només engloba pàgines buides o semibuides com molta gent pensa.

Tipus de pàgines considerades Thin Content

No hi ha un criteri oficial que ens digui que una pàgina pugui ser inclosa al sac de "pàgines inútils", ja que totes les pàgines poden ser-ho (fins i tot la pàgina d'inici). No obstant això, amb experiència som capaços de trobar patrons que ens permeten desenvolupar una classificació d'aquest tipus de pàgines.

Pàgines buides o semibuides

No només són pàgines pobres en contingut, sinó que el contingut no aporta res. Hem de recordar que la longitud del contingut no és un indicador de thin content ni de qualitat. Si aconseguim que l'usuari trobi tot el que cerca amb poc contingut, Google segurament ho recompensarà. La majoria d'aquests casos amb què s'enfronta normalment un SEO estan relacionats amb pàgines de resultats de cerca interna que s'indexen, filtres mal treballats o Tags.

Tags SEO indexats
Tags SEO indexats

Resultat de cerca indexable aleatori

Tags SEO indexables sense contingut
Tags SEO indexables sense contingut

Pàgina de TAGS indexable sense contingut

Per evitar que es produeixi aquest tipus de thin content, hauríem de procurar evitar fer aquest tipus de pàgines indexables, o controlar-ho amb molt detall. No hauríem de seguir aquest procediment a pàgines que poden ser una bona solució a la consulta feta pels usuaris a Google i que creiem que poden posicionar després d'una optimització adequada.

Pàgina TAGs amb contingut SEO
Pàgina TAGs amb contingut SEO

Exemple d'una pàgina de resultats de cerca indexada amb contingut adequat

Filtres SEO
Filtres SEO
Exemple d'una URL correctament indexada amb un filtre

Pàgina TAG seo amb contingut
Pàgina TAG seo amb contingut

Pàgina TAG indexable amb contingut relacionat.

En el cas dels tags, també recomanem el que ja s'ha mencionat moltes vegades: generar-los amb molta cura i sempre seguint una estratègia SEO significativa. D'aquesta manera ens assegurem que poden ser utilitzats com una categorització secundària, igual que es fa a molts mitjans de comunicació.

Pàgines amb contingut duplicat

Aquesta és una de les pràctiques més combatudes per Google: si el contingut no proporciona informació rellevant i diferent de la dels competidors, no serà reconegut per Google. No cal dir que copiar directament contingut d'altres portals significa que, en la majoria de casos, seràs penalitzat severament pels cercadors.

Fer spinning de text també es considera contingut duplicat, és a dir, copiar-lo i reescriure'l amb lleugeres adaptacions. El bot de Google és capaç de detectar plagi, encara que es canviïn algunes frases.

Traduir contingut d'un altre idioma i incloure'l directament al teu lloc web també es considera thin content.

El nostre consell és no agafar la drecera; si vols fer bon SEO, treballa-hi de valent, genera contingut interessant, i t'assegurem que els resultats arribaran abans del que esperes.

Contingut generat automàticament

En aquest cas, ens referim a contingut generat per eines o bots. És cert que la IA ha avançat molt i que es podrien generar textos relativament interessants, però segueix sent una pràctica representativa del black hat més bàsic que el teu lloc web acabarà pagant.

Els bots no són estúpids i els usuaris tampoc. Generar contingut que no aporta res a l'usuari es considera actualment a SEO Alive com el màxim contrapunt del SEO.

No siguis la cigala de la faula.

Contingut d'afiliats de baixa qualitat

Els llocs web d'afiliats que ofereixen consells de compra i ressenyes útils i completes no tenen res a témer de Google. No obstant això, les pàgines plenes d'enllaços d'afiliat que no ofereixen informació útil o rellevant per a l'usuari final són els objectius principals d'una penalització de Google.

Oh, la quantitat de pàgines d'aquest tipus que han rebut un disavow en auditories de link building!

Per evitar aquest tipus de penalització, ens hem d'assegurar que el lloc web tingui una finalitat més enllà de l'oferta d'afiliació i proporcionar oportunitats d'afiliació que coincideixin estretament amb el sector del teu lloc web.

Doorway Pages

Són fàcils d'identificar perquè s'han dissenyat principalment per a cercadors, no per a humans. Aquesta tècnica, ja en desús, consisteix a crear diverses pàgines/dominis amb l'objectiu de posicionar per a un terme molt específic o un grup de termes molt proper, i enllaçar-los o redirigir-los tots a la mateixa URL.

El contingut típic utilitzat en aquestes pàgines és similar a aquest:

doorway pages seo
doorway pages seo

Exemple d'una doorway page.

Des del nostre punt de vista, és una estratègia arcaica que en el SEO actual implicaria més esforç que resultats i és, per descomptat, thin content.

Com afecta el thin content a un lloc web?

Hem d'aclarir que el thin content sol penalitzar els llocs web massa desoptimitzats, que representen un caos estructural i de contingut que ni Google és capaç d'identificar, o aquells la construcció dels quals ha optat per la via "fàcil" utilitzant algunes (o moltes) tècniques black hat.

L'inconvenient principal de generar thin content en un lloc web és que s'exposa a ser penalitzat durament per Google, impedint-li aconseguir bones posicions a les SERP o causant que la seva posició baixi contínuament.

Però aquest no és l'únic inconvenient, ja que si un lloc web aconsegueix rebre visites de qualsevol canal, serà difícil retenir i convèncer els usuaris perquè interactuïn. A la situació en què es troba actualment el SEO, on l'usuari és el protagonista, aquest fet portarà a una pèrdua creixent d'autoritat.

Com detectar thin content amb Safecont

Després de tot el que ja sabies i després de llegir tot això, segurament no vols permetre que el teu lloc web tingui ni un bri de contingut inútil. Com t'acabem de dir, si tens una estratègia de contingut de qualitat i el teu lloc web presenta un nivell d'optimització adequat, no t'has de preocupar, però sí que recomanem que tinguis controlat aquest tipus de pàgines, especialment pels usuaris que hi puguin aterrar.

Per aquesta raó, pensem que és molt adequat parlar d'una de les eines que millor ens està funcionant a la nostra agència; volem que la coneguis per si, com a nosaltres, et pot ser útil a les teves auditories de contingut.

Deixa'ns dir-te, per als que no la conegueu, que Safecont és una eina espanyola especialitzada en anàlisi de contingut i arquitectura que utilitza tecnologia Machine Learning per detectar on es troben els problemes principals d'un lloc web. Amb ella podem detectar contingut de baixa qualitat que pot portar a penalitzacions i altres problemes.

Com el tema principal de l'article és el thin content, ens centrarem exclusivament en l'anàlisi que en fa l'eina. Un cop rastrejat el lloc web, en primera instància, al resum del rastreig ja trobem el nombre d'URL que presenten aquest problema.

Panell Safecont
Panell Safecont

Vista general del panell de l'eina SEO Safecont.

Si aprofundim a l'anàlisi específic…

Thin Content Safecont
Thin Content Safecont

La funció de detecció de thin content és una de les millors característiques de l'eina.

Trobem un resum molt visual i molt precís de l'estat del lloc web.

Anàlisi de Cluster Safecont
Anàlisi de Cluster Safecont

Vista general de l'anàlisi de clústers de SafeCont.

El primer que ens cridarà l'atenció, sense dubte, és el peculiar gràfic en forma de rinoceront (el logotip de l'eina, ja que un panda hauria estat massa obvi) que ens mostra el percentatge de risc de patir una penalització.

Risc de penalització SEO
Risc de penalització SEO

Gràfic de risc de penalització de Safecont.

Segons aquesta anàlisi, el lloc web compleix el nivell òptim de thin content i, de moment, Google no té cap raó per penalitzar-lo. A sota d'aquesta anàlisi veiem una taula i gràfic molt curiós i representatiu que ens permeten obtenir una vista general de l'estat del lloc web:

Clústers de Thin Content
Clústers de Thin Content

Anàlisi de thin content mitjançant clústers.

La taula ens mostra tres columnes:

  • Links: que proporciona, en intervals de 10, el percentatge de thin content que poden tenir les pàgines.
  • Pages: el nombre de pàgines que presenten cada percentatge de thin content.
  • Cluster Risk: la probabilitat que cadascuna de les pàgines dins de cada interval sigui penalitzada.

Sabem que expressat així pot semblar una mica confús, però la manera correcta d'interpretar-ho seria una cosa així: "Observem que la majoria de les pàgines (706) presenten un percentatge de thin content entre el 10 i el 20%, amb una probabilitat mitjana de ser penalitzades del 29,81%.

Només quatre pàgines tenen un percentatge de thin content superior al 40% i la probabilitat de ser penalitzades és del 36,98%."

El gràfic representa això, diferenciant cada interval per colors, sent el verd el del percentatge més baix de thin content i el vermell el del més alt. Per això el segon interval (10%-20%) es representa amb el major gruix.

I finalment…

Anàlisi d'URL de Safecont
Anàlisi d'URL de Safecont

Anàlisi individualitzada d'URL (thin content, risc de penalització...)

Safecont ens mostra una anàlisi individual de cada URL permetent-nos filtrar com vulguem. Juntament amb les URL, apareixen 3 punts de dades:

  • ThinRatio: percentatge de paraules similars dins de la mateixa pàgina
  • NUMWORDS: densitat de paraules incloses al contingut
  • PAGERISK: probabilitat que la pàgina pugui ser penalitzada.

Com hem dit al llarg de l'article, no podem centrar-nos exclusivament en la longitud del contingut, com fa l'eina en aquesta última part. No obstant això, és una cosa que hem de tenir present.

Aquesta eina s'ha d'entendre globalment, ja que ens permetrà fer auditories de contingut de molta qualitat. Et recomanem fortament que la provis.

** Nota: Aquest article no ha estat patrocinat, però realment creiem que Safecont aporta valor i és de gran qualitat, i per tant considerem adequat compartir-lo amb la comunitat SEO.*

Автор: David Kaufmann

David Kaufmann

He passat els últims 10+ anys completament obsessionat amb el SEO — i sincerament, no ho canviaria per res.

La meva carrera va fer un salt qualitatiu quan vaig treballar com a especialista SEO sènior a Chess.com — un dels 100 webs més visitats de tot Internet. Operar a aquesta escala em va ensenyar coses que cap curs ni certificació podrien transmetre.

D'aquella experiència vaig fundar SEO Alive — una agència per a marques que es prenen seriosament el creixement orgànic. I com que no trobava cap eina que gestionés bé tant el SEO clàssic com el món de la IA, vaig construir SEOcrawl. Si busques un partner SEO sènior que s'estimi aquest sector de debò — m'encantarà parlar amb tu!

→ Читайте всі статті від David
Більше статей: David Kaufmann

Дізнайтесь більше контенту цього автора