Thin Content: czym jest i jak go naprawić w SEO

W dzisiejszym artykule uznaliśmy, że warto poruszyć temat „thin content", czyli ubogiej lub słabej treści, ponieważ z naszego doświadczenia wynika, że jest to jedno z tych pojęć, które jest bardzo często używane w naszej branży, ale wielu specjalistów SEO nie wie dokładnie, do czego się odnosi, ponieważ jest ono znacznie szersze, niż się powszechnie wydaje.
Po raz pierwszy zaczęto brać pod uwagę to pojęcie po aktualizacji Google Panda, pierwszym poważnym algorytmie Google, w lutym 2011 roku (wtedy wielu z nas nie wiedziało nawet, czym jest SEO).
Jeśli chcesz poznać wszystko, co istotne na temat thin contentu i jak nad nim pracować z narzędziem, które uważamy za najlepsze do jego wykrywania (SafeCont), zapraszamy do dalszej lektury tego artykułu, który przygotowaliśmy z ogromnym entuzjazmem dla specjalistów SEO na całym świecie.
Czym jest Thin Content?
Thin content to treść strony internetowej, która dostarcza użytkownikowi niewielkiej wartości lub nie dostarcza jej wcale. Pojęcie to nie obejmuje wyłącznie stron pustych lub półpustych, jak wielu sądzi.
Typy stron uznawanych za Thin Content
Nie istnieje oficjalne kryterium, które mówi nam, że dana strona może zostać zaliczona do worka „bezużytecznych stron", ponieważ każda strona może nim być (nawet strona główna). Jednak z doświadczenia jesteśmy w stanie znaleźć pewne wzorce, które pozwalają nam opracować klasyfikację tego typu stron.
Strony puste lub półpuste
Strony te nie tylko są ubogie w treść, ale ich treść nic nie wnosi. Musimy pamiętać, że długość treści nie jest wskaźnikiem thin contentu ani jakości. Jeśli za pomocą niewielkiej ilości treści dostarczymy użytkownikowi wszystko, czego szuka, Google z pewnością to wynagrodzi. Większość przypadków, z którymi specjalista SEO zwykle ma do czynienia, dotyczy stron z wewnętrznymi wynikami wyszukiwania, które zostają zaindeksowane, źle zaprojektowanych filtrów lub Tagów.

Losowy zaindeksowany wynik wyszukiwania

Zaindeksowana strona TAGS bez treści
Aby zapobiec występowaniu tego typu thin contentu, powinniśmy starać się unikać czynienia tego rodzaju stron indeksowalnymi lub kontrolować to bardzo szczegółowo. Nie powinniśmy stosować tej procedury w przypadku stron, które mogą być dobrym rozwiązaniem dla zapytania zadawanego przez użytkowników w Google i które naszym zdaniem mogą się dobrze pozycjonować po odpowiedniej optymalizacji.

Przykład zaindeksowanej strony wyników wyszukiwania z odpowiednią treścią


Indeksowalna strona TAG z powiązaną treścią.
W przypadku tagów polecamy również to, co już wielokrotnie wspominaliśmy: generuj je bardzo ostrożnie i zawsze zgodnie z sensowną strategią SEO. W ten sposób mamy pewność, że można je wykorzystać jako drugorzędną kategoryzację, podobnie jak robi to wiele serwisów medialnych.
Strony z duplikatami treści
To jedna z praktyk, z którymi Google walczy najbardziej: jeśli treść nie dostarcza istotnych i odmiennych informacji w stosunku do treści konkurencji, nie zostanie uznana przez Google. Nie trzeba dodawać, że bezpośrednie kopiowanie treści z innych portali oznacza, że w większości przypadków zostaniesz surowo ukarany przez wyszukiwarki.
Spinning tekstu jest również uznawany za duplikat treści, czyli kopiowanie go i przepisywanie z niewielkimi modyfikacjami. Bot Google jest w stanie wykryć plagiat, nawet jeśli niektóre zdania zostały zmienione.
Tłumaczenie treści z innego języka i zamieszczanie jej bezpośrednio na swojej stronie również jest uznawane za thin content.
Naszą radą jest, abyś nie szedł na łatwiznę; jeśli chcesz robić dobre SEO, pracuj nad tym ciężko, twórz interesujące treści, a zapewniamy, że wyniki nadejdą prędzej niż później.
Treści generowane automatycznie
W tym przypadku mówimy o treściach generowanych przez narzędzia lub boty. To prawda, że AI bardzo się rozwinęło i można generować stosunkowo interesujące teksty, ale wciąż jest to praktyka reprezentatywna dla najbardziej podstawowego black hat, za którą Twoja strona w końcu zapłaci.
Boty nie są głupie, a użytkownicy też nie. Generowanie treści, która nie wnosi nic dla użytkownika, jest obecnie uznawane w SEO Alive za maksymalne przeciwieństwo SEO.
Nie bądź konikiem polnym z bajki.
Niskiej jakości treści afiliacyjne
Strony afiliacyjne, które oferują porady zakupowe i przydatne, kompletne recenzje, nie mają się czego obawiać ze strony Google. Jednak strony pełne linków afiliacyjnych, które nie oferują przydatnych ani istotnych informacji dla użytkownika końcowego, są głównym celem kary Google.
Och, ileż tego rodzaju stron otrzymało disavow w audytach link buildingu!
Aby uniknąć tego typu kary, musimy upewnić się, że strona ma cel wykraczający poza ofertę afiliacyjną i oferować możliwości afiliacyjne, które ściśle pasują do branży Twojej strony.
Doorway Pages
Łatwo je zidentyfikować, ponieważ zostały zaprojektowane głównie pod kątem wyszukiwarek, a nie ludzi. Ta technika, już wycofana z użycia, polega na tworzeniu kilku stron/domen w celu pozycjonowania na bardzo konkretne hasło lub bardzo zbliżoną grupę haseł i linkowaniu lub przekierowywaniu ich wszystkich do tego samego URL-a.
Typowa treść używana na tych stronach jest podobna do tej:

Przykład strony doorway.
Z naszego punktu widzenia jest to archaiczna strategia, która w dzisiejszym SEO wymagałaby więcej wysiłku niż przyniosłaby rezultatów i oczywiście jest thin contentem.
Jak thin content wpływa na stronę?
Musimy wyjaśnić, że thin content jest zwykle karany na stronach zbyt nieoptymalnych, które reprezentują strukturalny i treściowy chaos, którego nawet Google nie jest w stanie zidentyfikować, lub na tych, których konstrukcja postawiła na „łatwą" drogę poprzez wykorzystanie niektórych (lub wielu) technik black hat.
Główną wadą generowania thin contentu na stronie jest to, że naraża się ona na surowe karanie przez Google, uniemożliwiając osiągnięcie dobrych pozycji w SERP-ach lub powodując ciągły spadek pozycji.
Ale to nie jedyna wada, ponieważ jeśli stronie uda się otrzymać wizyty z dowolnego kanału, trudno będzie zatrzymać użytkowników i przekonać ich do interakcji. W sytuacji, w której obecnie znajduje się SEO, gdzie użytkownik jest protagonistą, fakt ten doprowadzi do zwiększonej utraty autorytetu.
Jak wykrywać thin content za pomocą Safecont
Po wszystkim, co już wiedziałeś, i po przeczytaniu tego wszystkiego, z pewnością nie chcesz pozwolić, aby Twoja strona miała choćby odrobinę bezużytecznej treści. Jak właśnie powiedzieliśmy, jeśli masz strategię treści wysokiej jakości, a Twoja strona prezentuje odpowiedni poziom optymalizacji, nie powinieneś się martwić, ale zalecamy, abyś trzymał kontrolę nad tego typu stronami, zwłaszcza ze względu na użytkowników, którzy mogą na nich wylądować.
Z tego powodu uważamy, że warto opowiedzieć o jednym z narzędzi, które najlepiej sprawdza się w naszej agencji; chcemy, abyś je poznał na wypadek, gdyby, podobnie jak nam, mogło się przydać przy Twoich audytach treści.
Pozwól, że powiemy ci, dla tych z was, którzy go nie znają, że Safecont to hiszpańskie narzędzie wyspecjalizowane w analizie treści i architektury, które wykorzystuje technologię Machine Learning do wykrywania, gdzie znajdują się główne problemy strony. Dzięki niemu możemy wykryć treści niskiej jakości, które mogą prowadzić do kar i innych problemów.
Ponieważ głównym tematem artykułu jest thin content, skupimy się wyłącznie na analizie, jaką narzędzie przeprowadza pod tym kątem. Po przeskanowaniu strony, na pierwszy rzut oka, w podsumowaniu crawlu znajdujemy już liczbę URL-i, które prezentują ten problem.

Ogólny widok pulpitu narzędzia SEO Safecont.
Jeśli wejdziemy głębiej w konkretną analizę…

Funkcja wykrywania thin contentu jest jedną z najlepszych funkcji narzędzia.
Znajdujemy bardzo wizualne i bardzo dokładne podsumowanie stanu strony.

Ogólny widok analizy klastrów SafeCont.
Pierwszą rzeczą, która bez wątpienia przykuje naszą uwagę, jest osobliwy wykres w kształcie nosorożca (logo narzędzia, ponieważ panda byłaby zbyt oczywista), który pokazuje nam procentowe ryzyko otrzymania kary.

Wykres ryzyka kary Safecont.
Zgodnie z tą analizą strona spełnia optymalny poziom thin contentu i na razie Google nie ma powodu, aby ją karać. Pod tą analizą widzimy bardzo ciekawą i reprezentatywną tabelę oraz wykres, które pozwalają nam uzyskać ogólny widok stanu strony:

Analiza thin contentu poprzez klastry.
Tabela pokazuje nam trzy kolumny:
- Links: która podaje, w przedziałach co 10, procent thin contentu, jaki mogą posiadać strony.
- Pages: liczba stron, które prezentują każdy procent thin contentu.
- Cluster Risk: prawdopodobieństwo, że każda ze stron w danym przedziale zostanie ukarana.
Wiemy, że wyrażone w ten sposób może to wydawać się trochę mylące, ale poprawny sposób interpretacji byłby mniej więcej taki: „Obserwujemy, że większość stron (706) prezentuje procent thin contentu między 10 a 20%, ze średnią szansą otrzymania kary 29,81%.
Tylko cztery strony mają procent thin contentu większy niż 40%, a szansa otrzymania kary wynosi 36,98%."
Wykres reprezentuje to, różnicując każdy przedział kolorami, gdzie zielony to ten z najniższym procentem thin contentu, a czerwony z najwyższym. Dlatego drugi przedział (10%-20%) jest reprezentowany z największą grubością.
I wreszcie…

Indywidualna analiza URL-i (thin content, ryzyko kary...)
…Safecont pokazuje nam indywidualną analizę każdego URL-a, pozwalając filtrować według uznania. Wraz z URL-ami pojawiają się 3 dane:
- ThinRatio: procent podobnych słów na tej samej stronie
- NUMWORDS: gęstość słów zawartych w treści
- PAGERISK: prawdopodobieństwo, że strona może zostać ukarana.
Jak powiedzieliśmy w trakcie artykułu, nie możemy skupiać się wyłącznie na długości treści, jak narzędzie skupia się w tej ostatniej części. Niemniej jednak jest to coś, o czym musimy pamiętać.
To narzędzie należy rozumieć globalnie, ponieważ pozwoli nam przeprowadzać audyty treści bardzo wysokiej jakości. Zdecydowanie polecamy je wypróbować.
** Uwaga: Ten artykuł nie został sponsorowany, ale naprawdę uważamy, że Safecont dostarcza wartości i jest wysokiej jakości, dlatego uznaliśmy za stosowne podzielić się nim ze społecznością SEO.*
Autor: David Kaufmann

Ostatnie ponad 10 lat spędziłem kompletnie zafascynowany SEO — i szczerze mówiąc, nie zamieniłbym tego na nic innego.
Moja kariera wskoczyła na zupełnie nowy poziom, gdy pracowałem jako senior SEO specialist w Chess.com — jednej ze 100 najczęściej odwiedzanych stron w całym internecie. Działanie na taką skalę, na milionach podstron, w dziesiątkach języków i w jednych z najbardziej konkurencyjnych SERPs, nauczyło mnie rzeczy, których nie dałby żaden kurs ani certyfikat. To doświadczenie zmieniło moje spojrzenie na to, jak naprawdę wygląda świetne SEO — i stało się fundamentem wszystkiego, co zbudowałem od tamtej pory.
Z tego doświadczenia narodziło się SEO Alive — agencja dla marek, które na poważnie podchodzą do wzrostu organicznego. Nie jesteśmy tu po to, żeby sprzedawać dashboards i miesięczne raporty. Jesteśmy tu, żeby budować strategie, które realnie robią różnicę, łącząc to, co najlepsze w klasycznym SEO, z ekscytującym nowym światem Generative Engine Optimization (GEO) — tak, aby Twoja marka pojawiała się nie tylko w niebieskich linkach Google, ale też wewnątrz odpowiedzi generowanych przez AI, które ChatGPT, Perplexity i Google AI Overviews dostarczają każdego dnia milionom ludzi.
A ponieważ nie mogłem znaleźć narzędzia, które potrafiłoby porządnie obsłużyć oba te światy, zbudowałem je sam — SEOcrawl, platformę enterprise SEO intelligence, która łączy w jednym miejscu rankings, audyty techniczne, monitoring backlinks, kondycję crawl i śledzenie widoczności marki w AI. To platforma, o której istnieniu zawsze marzyłem.
Odkryj więcej treści tego autora

