Thin Content: O Que É e Como Corrigi-lo no Seu Site

No artigo de hoje, achamos apropriado abordar o conceito de "thin content" ou conteúdo escasso/pobre porque, com base em nossa experiência, pudemos verificar que é um daqueles conceitos muito usados em nosso setor, mas que muitos SEOs não sabem exatamente a que se refere, já que é muito mais amplo do que as pessoas pensam.
Esse conceito foi considerado pela primeira vez após a atualização do Google Panda, o primeiro grande algoritmo do Google, em fevereiro de 2011 (naquela época, muitos de nós ainda não sabíamos o que era SEO).
Se você quer saber tudo de importante sobre o thin content e como trabalhá-lo com o que consideramos a melhor ferramenta para detectá-lo (SafeCont), convidamos você a continuar lendo este artigo que preparamos com grande entusiasmo para SEOs ao redor do mundo.
O que é Thin Content?
Thin content é o conteúdo de uma página web que fornece pouco ou nenhum valor ao usuário. Esse conceito não engloba apenas páginas vazias ou semi-vazias, como muitas pessoas pensam.
Tipos de páginas consideradas Thin Content
Não existe um critério oficial que nos diga que uma página pode ser incluída no saco de "páginas inúteis", já que todas as páginas podem ser (até mesmo a página inicial). No entanto, com a experiência somos capazes de encontrar padrões que nos permitem desenvolver uma classificação desse tipo de páginas.
Páginas vazias ou semi-vazias
Essas páginas não são apenas pobres em conteúdo, mas o conteúdo não contribui em nada. Devemos lembrar que o comprimento do conteúdo não é um indicador de thin content ou de qualidade. Se conseguirmos que o usuário tenha tudo o que está procurando com pouco conteúdo, o Google certamente recompensará isso. A maioria desses casos que um SEO geralmente enfrenta está relacionada a páginas de resultados de busca interna que são indexadas, filtros mal trabalhados ou Tags.

Resultado de busca aleatório indexável

Página de TAGS indexável sem conteúdo
Para evitar que esse tipo de thin content ocorra, devemos tentar evitar tornar esses tipos de páginas indexáveis, ou controlá-lo em grande detalhe. Não devemos seguir esse procedimento em páginas que possam ser uma boa solução para a consulta feita pelos usuários no Google e que acreditemos que possam se posicionar após uma otimização adequada.

Exemplo de uma página de resultados de busca indexada com conteúdo apropriado


Página de TAG indexável com conteúdo relacionado.
No caso das tags, também recomendamos o que já foi mencionado em muitas ocasiões: gerá-las com muito cuidado e sempre seguindo uma estratégia de SEO significativa. Dessa forma, garantimos que possam ser usadas como uma categorização secundária, assim como é feito em muitos veículos de mídia.
Páginas com conteúdo duplicado
Esta é uma das práticas mais combatidas pelo Google: se o conteúdo não fornece informações relevantes e diferentes das dos concorrentes, ele não será reconhecido pelo Google. Não é preciso dizer que copiar diretamente o conteúdo de outros portais significa que, na maioria dos casos, você será severamente penalizado pelos mecanismos de busca.
A reescrita de texto também é considerada conteúdo duplicado, ou seja, copiá-lo e reescrevê-lo com pequenas adaptações. O bot do Google é capaz de detectar plágio, mesmo que algumas frases sejam alteradas.
Traduzir conteúdo de outro idioma e incluí-lo diretamente em seu site também é considerado thin content.
Nosso conselho é não pegar atalhos; se você quer fazer um bom SEO, trabalhe duro nisso, gere conteúdo interessante, e garantimos que os resultados virão mais cedo do que tarde.
Conteúdo gerado automaticamente
Neste caso, estamos nos referindo a conteúdo gerado por ferramentas ou bots. É verdade que a IA avançou muito e que textos relativamente interessantes poderiam ser gerados, mas ainda é uma prática representativa do black hat mais básico que seu site acabará pagando.
Os bots não são burros e nem os usuários. Gerar conteúdo que não contribui em nada ao usuário é atualmente considerado na SEO Alive como o contraponto máximo do SEO.
Não seja o gafanhoto da fábula.
Conteúdo de afiliados de baixa qualidade
Sites de afiliados que oferecem conselhos de compra e avaliações úteis e completas não têm nada a temer do Google. No entanto, páginas cheias de links de afiliados que não oferecem informações úteis ou relevantes para o usuário final são os principais alvos de uma penalização do Google.
Ah, o número de páginas desse tipo que receberam um disavow em auditorias de link building!
Para evitar esse tipo de penalização, devemos garantir que o site tenha um propósito além da oferta de afiliados e fornecer oportunidades de afiliados que correspondam de perto ao setor do seu site.
Doorway Pages
São fáceis de identificar porque foram projetadas principalmente para mecanismos de busca, não para humanos. Esta técnica, já em desuso, consiste em criar várias páginas/domínios com o objetivo de se posicionar para um termo muito específico ou um grupo muito próximo de termos, e vinculá-los ou redirecioná-los todos para a mesma URL.
O conteúdo típico usado nessas páginas é semelhante a este:

Exemplo de uma doorway page.
Do nosso ponto de vista, é uma estratégia arcaica que no SEO atual envolveria mais esforço do que resultados e é, claro, thin content.
Como o thin content afeta um site?
Temos que esclarecer que o thin content geralmente é penalizado em sites que estão muito desotimizados, que representam um caos estrutural e de conteúdo que nem o Google é capaz de identificar, ou aqueles cuja construção optou pelo caminho "fácil" usando algumas (ou muitas) técnicas de black hat.
A principal desvantagem de gerar thin content em um site é que ele se expõe a ser severamente penalizado pelo Google, impedindo-o de obter boas classificações nas SERPs ou fazendo com que sua posição caia continuamente.
Mas essa não é a única desvantagem, já que se um site conseguir receber visitas de qualquer canal, será difícil reter e convencer os usuários a interagir. Na situação em que o SEO se encontra atualmente, onde o usuário é o protagonista, esse fato levará a uma maior perda de autoridade.
Como detectar thin content com Safecont
Depois de tudo o que você já sabia e depois de ler tudo isso, certamente você não quer permitir que seu site tenha nem um pouco de conteúdo inútil. Como acabamos de dizer, se você tem uma estratégia de conteúdo de qualidade e seu site apresenta um nível apropriado de otimização, você não deveria se preocupar, mas recomendamos que você mantenha o controle desse tipo de páginas, especialmente por causa dos usuários que possam pousar nelas.
Por essa razão, achamos muito apropriado falar sobre uma das ferramentas que está funcionando melhor para nós em nossa agência; queremos que você a conheça caso, como nós, possa ser útil para você em suas auditorias de conteúdo.
Vamos contar a você, para aqueles que não a conhecem, que Safecont é uma ferramenta espanhola especializada em análise de conteúdo e arquitetura que usa tecnologia de Machine Learning para detectar onde estão os principais problemas de um site. Com ela podemos detectar conteúdo de baixa qualidade que pode levar a penalizações e outros problemas.
Como o tema principal do artigo é thin content, vamos focar exclusivamente na análise que a ferramenta realiza dele. Uma vez que o site é rastreado, em primeira instância, no resumo do rastreamento já encontramos o número de URLs que apresentam esse problema.

Visão geral do dashboard da ferramenta de SEO Safecont.
Se nos aprofundarmos na análise específica…

A função de detecção de thin content é uma das melhores funcionalidades da ferramenta.
Encontramos um resumo muito visual e muito preciso do status do site.

Visão geral da análise de cluster do SafeCont.
A primeira coisa que chamará nossa atenção, sem dúvida, é o peculiar gráfico em forma de rinoceronte (o logo da ferramenta, já que um panda teria sido óbvio demais) que nos mostra a porcentagem de risco de sofrer uma penalização.

Gráfico de risco de penalização Safecont.
De acordo com esta análise, o site atende ao nível ótimo de thin content e, por enquanto, o Google não tem motivos para penalizá-los. Abaixo desta análise, vemos uma tabela e um gráfico muito curiosos e representativos que nos permitem ter uma visão geral do status do site:

Análise de thin content através de clusters.
A tabela nos mostra três colunas:
- Links: que fornece, em intervalos de 10, a porcentagem de thin content que as páginas podem ter.
- Páginas: o número de páginas que apresentam cada porcentagem de thin content.
- Cluster Risk: a probabilidade de que cada uma das páginas dentro de cada intervalo seja penalizada.
Sabemos que expressar dessa forma pode parecer um pouco confuso, mas a maneira correta de interpretá-lo seria algo assim: "Observamos que a maioria das páginas (706) apresenta uma porcentagem de thin content entre 10 e 20%, com uma chance média de ser penalizada de 29,81%.
Apenas quatro páginas têm uma porcentagem de thin content maior que 40% e a chance de ser penalizada é de 36,98%."
O gráfico representa isso, diferenciando cada intervalo por cores, sendo o verde aquele com a menor porcentagem de thin content e o vermelho aquele com a maior. É por isso que o segundo intervalo (10%-20%) é representado com a maior espessura.
E finalmente…

Análise individualizada de URL (thin content, risco de penalização...)
…O Safecont nos mostra uma análise individual de cada URL permitindo-nos filtrar conforme desejado. Junto com as URLs, aparecem 3 dados:
- ThinRatio: porcentagem de palavras semelhantes dentro da mesma página
- NUMWORDS: densidade de palavras incluídas no conteúdo
- PAGERISK: probabilidade de que a página possa ser penalizada.
Como dissemos ao longo do artigo, não podemos focar exclusivamente no comprimento do conteúdo, como a ferramenta foca nesta última parte. No entanto, é algo que devemos ter em mente.
Esta ferramenta deve ser entendida globalmente, pois nos permitirá realizar auditorias de conteúdo de altíssima qualidade. Recomendamos fortemente que você experimente.
** Nota: Este artigo não foi patrocinado, mas realmente acreditamos que o Safecont fornece valor e é de grande qualidade, e portanto consideramos apropriado compartilhá-lo com a comunidade SEO.*
Autor: David Kaufmann

Passei os últimos 10 e tantos anos completamente obcecado por SEO — e, sinceramente, não quereria que fosse de outra forma.
A minha carreira atingiu um novo patamar quando trabalhei como Senior SEO Specialist na Chess.com — um dos 100 sites mais visitados de toda a internet. Operar nessa escala, em milhões de páginas, dezenas de idiomas e numa das SERPs mais competitivas que existem, ensinou-me coisas que nenhum curso ou certificação jamais poderia. Essa experiência mudou a minha perspetiva sobre o que é realmente um grande trabalho de SEO — e tornou-se a base de tudo o que construí desde então.
Foi a partir dessa experiência que fundei a SEO Alive — uma agência para marcas que levam a sério o crescimento orgânico. Não estamos aqui para vender dashboards e relatórios mensais. Estamos aqui para construir estratégias que realmente fazem a diferença, combinando o melhor do SEO clássico com o novo e empolgante mundo da Generative Engine Optimization (GEO) — garantindo que a tua marca apareça não só nos links azuis do Google, mas também dentro das respostas geradas por AI que o ChatGPT, o Perplexity e o Google AI Overviews entregam a milhões de pessoas todos os dias.
E como não consegui encontrar uma ferramenta que lidasse corretamente com esses dois mundos, construí uma eu mesmo — a SEOcrawl, uma plataforma enterprise de SEO intelligence que reúne rankings, auditorias técnicas, monitoramento de backlinks, saúde do crawl e tracking de visibilidade de marca em AI, tudo num só lugar. É a plataforma que sempre desejei que existisse.
Descubra mais conteúdos deste autor

