Thin content: co to je a jak ho opravit

Thin content: co to je a jak ho opravit

V dnešním článku jsme se rozhodli věnovat pojmu „thin content" neboli řídkému či nekvalitnímu obsahu. Z naší zkušenosti totiž víme, že jde o termín, který se v našem oboru hojně používá, ale mnoho SEO specialistů přesně neví, co znamená, protože je mnohem širší, než si lidé myslí.

Tento koncept se poprvé objevil po aktualizaci Google Panda, prvním velkém algoritmu Googlu, v únoru 2011 (tehdy mnozí z nás ještě ani nevěděli, co je SEO).

Pokud chcete vědět vše důležité o thin contentu a jak na něm pracovat s tím, co považujeme za nejlepší nástroj pro jeho odhalování (SafeCont), zveme vás k přečtení tohoto článku, který jsme připravili s velkým nasazením pro SEO specialisty po celém světě.

Co je thin content?

Thin content je obsah webové stránky, která uživateli poskytuje malou nebo žádnou hodnotu. Tento koncept zahrnuje nejen prázdné nebo poloprázdné stránky, jak si mnozí myslí.

Typy stránek považovaných za thin content

Neexistuje oficiální kritérium, které by říkalo, že stránka patří mezi „neužitečné" (může jí být i homepage). Ze zkušenosti však dokážeme nalézt vzorce, které umožňují vytvořit klasifikaci tohoto typu stránek.

Prázdné nebo poloprázdné stránky

Tyto stránky mají nejen málo obsahu, ale obsah ani ničím nepřispívá. Pamatujme, že délka obsahu není ukazatelem thin contentu ani kvality. Pokud uživatel najde vše, co hledá, i v krátkém obsahu, Google to jistě ocení. Nejčastěji se s tímto případem setkáváme u indexovaných stránek interních výsledků vyhledávání, špatně nastavených filtrů nebo tagů.

Indexovaná SEO tagová stránka
Indexovaná SEO tagová stránka

Náhodný indexovatelný výsledek vyhledávání

Indexovatelné SEO tagy bez obsahu
Indexovatelné SEO tagy bez obsahu

Indexovatelná stránka tagů bez obsahu

Abychom tomuto typu thin contentu předešli, měli bychom se vyhnout tomu, aby tyto stránky byly indexovatelné, nebo to mít pod detailní kontrolou. Tento postup ale neuplatňujeme na stránkách, které mohou být dobrým řešením dotazu uživatele a u kterých věříme, že se po správné optimalizaci mohou dobře umístit.

Tagová stránka se SEO obsahem
Tagová stránka se SEO obsahem

Příklad indexované stránky výsledků vyhledávání s vhodným obsahem

SEO filtry
SEO filtry
Příklad správně indexované URL s filtrem

Tagová SEO stránka s obsahem
Tagová SEO stránka s obsahem

Indexovatelná stránka tagů s relevantním obsahem.

V případě tagů doporučujeme to, co bylo již mnohokrát zmíněno: vytvářet je opatrně a vždy podle smysluplné SEO strategie. Tak je možné je využít jako sekundární kategorizaci, jak to dělá řada médií.

Stránky s duplicitním obsahem

Jde o jednu z praktik, proti kterým Google bojuje nejvíce: pokud obsah neposkytuje relevantní a odlišné informace od konkurence, Google jej nezohlední. Není třeba dodávat, že přímé kopírování obsahu z jiných portálů ve většině případů znamená tvrdý postih ze strany vyhledávačů.

Za duplicitní obsah se považuje i tzv. spinning textu, tedy zkopírování s drobnými úpravami. Robot Googlu dokáže odhalit plagiátorství, i když změníte několik vět.

Za thin content se také považuje překlad obsahu z jiného jazyka a jeho přímé umístění na váš web.

Naše rada je: nehledejte zkratky. Pokud chcete dělat dobré SEO, pracujte na něm pořádně, vytvářejte zajímavý obsah, a my vás ujišťujeme, že výsledky přijdou dříve, než byste čekali.

Automaticky generovaný obsah

V tomto případě hovoříme o obsahu generovaném nástroji nebo boty. Je pravda, že AI značně pokročila a dokáže generovat relativně zajímavé texty, ale stále jde o praktiku představující nejzákladnější black hat, za kterou váš web nakonec zaplatí.

Boti nejsou hloupí a uživatelé také ne. Generování obsahu, který uživateli nic nepřináší, je v současnosti považováno za maximální protipól dobrého SEO.

Nebuďte tou cikádou z bajky.

Nekvalitní affiliate obsah

Affiliate weby, které nabízejí nákupní rady a užitečné, kompletní recenze, se Googlu obávat nemusí. Naopak stránky plné affiliate odkazů, které neposkytují žádné užitečné nebo relevantní informace pro koncového uživatele, jsou hlavními cíli Google penalizace.

A kolik takových stránek dostalo disavow při auditech link buildingu!

Abyste se vyhnuli tomuto typu penalizace, musíte se ujistit, že web má jiný účel než pouhou affiliate nabídku, a poskytovat affiliate příležitosti, které úzce odpovídají oboru vašeho webu.

Doorway pages

Snadno je rozeznáte, protože jsou navrženy primárně pro vyhledávače, ne pro lidi. Tato dnes již nepoužívaná technika spočívá ve vytváření několika stránek/domén s cílem umístit se na velmi konkrétní výraz nebo úzkou skupinu výrazů, přičemž všechny odkazují nebo přesměrovávají na stejnou URL.

Typický obsah na těchto stránkách vypadá podobně jako tento:

doorway pages SEO
doorway pages SEO

Příklad doorway page.

Z našeho pohledu jde o archaickou strategii, která by v současném SEO vyžadovala víc úsilí než výsledků a samozřejmě jde o thin content.

Jak thin content ovlivňuje web?

Musíme vyjasnit, že thin content je obvykle penalizován na webech, které jsou příliš deoptimalizované, představují strukturální a obsahový chaos, který nezvládá identifikovat ani Google, nebo na těch, jejichž tvorba zvolila „snadnou" cestu pomocí (mnoha) black hat technik.

Hlavní nevýhodou generování thin contentu je, že se web vystavuje tvrdé penalizaci ze strany Googlu, což mu brání v dosažení dobrého umístění v SERPech nebo způsobuje neustálý pokles pozic.

To ale není jediná nevýhoda: pokud web zvládne získat návštěvy z jakéhokoliv kanálu, bude těžké uživatele udržet a přesvědčit je k interakci. V současné situaci, kdy je hlavním aktérem SEO uživatel, povede tento fakt ke stále větší ztrátě autority.

Jak odhalit thin content pomocí Safecontu

Po všem, co už víte, a po přečtení tohoto článku jistě nechcete, aby váš web měl byť i jen kousek neužitečného obsahu. Jak jsme právě řekli, pokud máte kvalitní obsahovou strategii a váš web vykazuje vhodnou úroveň optimalizace, nemusíte se znepokojovat, ale doporučujeme tento typ stránek monitorovat, zejména kvůli uživatelům, kteří na nich mohou přistát.

Z toho důvodu považujeme za vhodné zmínit jeden z nástrojů, který se nám v naší agentuře nejvíce osvědčuje; chceme, abyste ho poznali, kdyby se vám podobně jako nám hodil při auditech obsahu.

Safecont je španělský nástroj specializovaný na analýzu obsahu a architektury, který využívá technologii Machine Learning k odhalování hlavních problémů webu. Pomocí něj dokážeme detekovat nekvalitní obsah, který může vést k penalizacím a dalším problémům.

Vzhledem k tomu, že hlavním tématem článku je thin content, zaměříme se výhradně na analýzu, kterou nástroj v této oblasti provádí. Po procrawlování webu najdeme v souhrnu rovnou počet URL s tímto problémem.

Safecont dashboard
Safecont dashboard

Obecný pohled na dashboard nástroje Safecont.

Pokud se ponoříme do konkrétní analýzy…

Thin content Safecont
Thin content Safecont

Funkce detekce thin contentu je jednou z nejlepších vlastností nástroje.

Najdeme velmi vizuální a velmi přesné shrnutí stavu webu.

Safecont Cluster Analysis
Safecont Cluster Analysis

Obecný pohled na clusterovou analýzu Safecontu.

První, co bezpochyby upoutá pozornost, je zvláštní graf ve tvaru nosorožce (logo nástroje, protože panda by byla příliš okatá), který nám ukazuje procento rizika penalizace.

Riziko SEO penalizace
Riziko SEO penalizace

Graf rizika penalizace v Safecontu.

Podle této analýzy web splňuje optimální úroveň thin contentu a Google v tuto chvíli nemá důvod jej penalizovat. Pod touto analýzou najdeme zajímavou a reprezentativní tabulku a graf, které poskytují obecný pohled na stav webu:

Clustery thin contentu
Clustery thin contentu

Analýza thin contentu prostřednictvím clusterů.

Tabulka má tři sloupce:

  • Links: poskytuje v intervalech po 10 procento thin contentu, které stránky mohou mít.
  • Pages: počet stránek, které vykazují každé procento thin contentu.
  • Cluster Risk: pravděpodobnost, že každá ze stránek v daném intervalu bude penalizována.

Víme, že takto vyjádřeno to může působit zmateně, ale správná interpretace by zněla například: „Pozorujeme, že většina stránek (706) má thin content mezi 10 a 20 %, s průměrnou pravděpodobností penalizace 29,81 %.

Pouze čtyři stránky mají thin content vyšší než 40 % a pravděpodobnost penalizace je 36,98 %."

Graf to znázorňuje, přičemž každý interval rozlišuje barvami; zelená patří intervalu s nejnižším procentem thin contentu a červená tomu nejvyššímu. Proto je druhý interval (10–20 %) zobrazen s největší tloušťkou.

A nakonec…

Safecont URL Analysis
Safecont URL Analysis

Individuální analýza URL (thin content, riziko penalizace…)

Safecont nám zobrazuje individuální analýzu každé URL s možností filtrování. Spolu s URL se objevují 3 údaje:

  • ThinRatio: procento podobných slov v rámci stejné stránky.
  • NUMWORDS: hustota slov obsažených v textu.
  • PAGERISK: pravděpodobnost, že stránka může být penalizována.

Jak jsme uvedli v celém článku, nemůžeme se zaměřit výhradně na délku obsahu, na kterou nástroj v této poslední části cílí. Přesto jde o aspekt, který musíme mít na paměti.

Tento nástroj je třeba chápat globálně, protože nám umožní provádět velmi kvalitní obsahové audity. Doporučujeme jej vyzkoušet.

** Poznámka: Tento článek nebyl sponzorován, ale skutečně věříme, že Safecont přináší hodnotu a má vysokou kvalitu, a proto považujeme za vhodné jej sdílet se SEO komunitou.*

Autor: David Kaufmann

David Kaufmann

Posledních 10+ let jsem byl naprosto posedlý SEO — a upřímně, jinak bych to mít ani nechtěl.

Moje kariéra dostala nový rozměr, když jsem pracoval jako senior SEO specialista pro Chess.com — jeden ze 100 nejnavštěvovanějších webů celého internetu. Pracovat v takovém měřítku, na milionech stránek, v desítkách jazyků a v jedné z nejkonkurenčnějších SERP, mě naučilo věci, které žádný kurz ani certifikát nemůže předat. Tato zkušenost změnila mou perspektivu na to, jak vypadá opravdu skvělé SEO — a stala se základem všeho, co jsem od té doby vybudoval.

Z této zkušenosti jsem založil SEO Alive — agenturu pro značky, které to s organickým růstem myslí vážně. Nejsme tady, abychom prodávali dashboardy a měsíční reporty. Jsme tady, abychom stavěli strategie, které opravdu pohnou výsledky, kombinací toho nejlepšího z klasického SEO se vzrušujícím novým světem Generative Engine Optimization (GEO) — abychom zajistili, že se vaše značka objeví nejen v modrých odkazech Googlu, ale i uvnitř odpovědí generovaných AI, které ChatGPT, Perplexity a Google AI Overviews každý den dodávají milionům lidí.

A protože jsem nenašel nástroj, který by oba tyto světy zvládal pořádně, postavil jsem si vlastní — SEOcrawl, enterprise SEO intelligence platformu, která spojuje rankings, technické audity, monitoring backlinků, zdraví crawlu a sledování viditelnosti značky v AI na jednom místě. Je to platforma, kterou jsem si vždy přál, aby existovala.

→ Přečíst všechny články od David
Další články od David Kaufmann

Objevte další obsah od tohoto autora