Thin Content: що це таке і як це виправити

У сьогоднішній статті ми вирішили звернутися до концепції «thin content» або бідного/порожнього контенту, тому що з нашого досвіду ми мали можливість переконатися, що це одна з тих концепцій, яка часто використовується в нашому секторі, але багато SEO-фахівців не знають точно, до чого вона стосується, оскільки вона набагато ширша, ніж люди думають.
Ця концепція вперше розглядалася після оновлення Google Panda — першого великого алгоритму Google, у лютому 2011 року (тоді багато з нас навіть не знали, що таке SEO).
Якщо ви хочете дізнатися все важливе про thin content і як з ним працювати з тим, що ми вважаємо найкращим інструментом для його виявлення (SafeCont), запрошуємо вас читати далі цю статтю, яку ми підготували з великим ентузіазмом для SEO-фахівців з усього світу.
Що таке Thin Content?
Thin content — це контент вебсторінки, що надає мало або жодної цінності відвідувачеві. Ця концепція охоплює не лише порожні чи напівпорожні сторінки, як багато хто думає.
Типи сторінок, що вважаються Thin Content
Немає офіційного критерію, що каже нам, що сторінку можна включити до категорії «непотрібні сторінки», оскільки усі сторінки можуть нею бути (навіть домашня сторінка). Однак з досвідом ми можемо знаходити патерни, що дозволяють розробити класифікацію цього типу сторінок.
Порожні чи напівпорожні сторінки
Ці сторінки не лише бідні на контент, а й контент нічого не вносить. Маємо пам'ятати, що довжина контенту не є показником thin content або якості. Якщо ми надамо відвідувачеві все, що він шукає, з невеликою кількістю контенту, Google напевно це винагородить. Більшість таких випадків, з якими SEO-фахівець зазвичай стикається, пов'язані з внутрішніми сторінками результатів пошуку, що індексуються, погано опрацьованими фільтрами або тегами.

Випадковий індексований результат пошуку

Сторінка індексованого TAG без контенту
Щоб запобігти такому виду thin content, ми маємо намагатися не робити такі сторінки індексованими або контролювати це дуже детально. Не варто слідувати цій процедурі на сторінках, які можуть бути хорошим рішенням для запиту, який роблять відвідувачі в Google, і які, як ми вважаємо, можуть ранжуватися після належної оптимізації.

Приклад індексованої сторінки результатів пошуку з відповідним контентом


Індексована сторінка TAG з пов'язаним контентом.
У випадку тегів ми також рекомендуємо те, що вже згадано неодноразово: створюйте їх дуже обережно і завжди дотримуючись осмисленої SEO-стратегії. Таким чином ми переконуємося, що їх можна використовувати як вторинну категоризацію, як це робиться в багатьох ЗМІ.
Сторінки з дубльованим контентом
Це одна з практик, з якою найбільше бореться Google: якщо контент не надає релевантної й відмінної інформації від інформації конкурентів, він не буде визнаний Google. Безперечно, безпосереднє копіювання контенту з інших порталів означає, що в більшості випадків ви будете суворо покарані пошуковиками.
Спінінг тексту також вважається дубльованим контентом, тобто його копіюванням і переписуванням з невеликими адаптаціями. Бот Google здатний виявити плагіат, навіть якщо деякі речення змінено.
Переклад контенту з іншої мови та безпосереднє включення його на ваш вебсайт також вважається thin content.
Наша порада — не йти швидким шляхом; якщо хочете робити хороший SEO, працюйте над цим наполегливо, генеруйте цікавий контент, і ми вас запевняємо, що результати прийдуть швидше, ніж пізніше.
Автоматично згенерований контент
У цьому випадку ми маємо на увазі контент, згенерований інструментами або ботами. Правда, AI значно просунувся, і відносно цікаві тексти можна було б генерувати, але це все ще практика, представницька для найбазовішого black hat, за яку ваш вебсайт врешті-решт заплатить.
Боти не дурні, як і відвідувачі. Генерування контенту, що нічого не вносить для відвідувача, наразі вважається в SEO Alive максимальною протилежністю SEO.
Не будьте коником-стрибунцем з байки.
Низькоякісний партнерський контент
Партнерські вебсайти, що пропонують поради з покупки та корисні, повноцінні огляди, не повинні нічого боятися від Google. Однак сторінки, повні партнерських посилань, що не пропонують корисної чи релевантної інформації для кінцевого відвідувача, є основною мішенню санкцій Google.
О, скільки сторінок такого типу отримали disavow в аудитах лінкбілдингу!
Щоб уникнути такого типу санкцій, ми маємо переконатися, що вебсайт має мету, що виходить за межі партнерської пропозиції, і надавати партнерські можливості, що тісно відповідають сектору вашого вебсайту.
Doorway Pages
Їх легко ідентифікувати, оскільки вони були спроєктовані переважно для пошуковиків, а не для людей. Ця техніка, що вже не використовується, полягає у створенні кількох сторінок/доменів з метою ранжування за дуже конкретним терміном чи дуже близькою групою термінів і пов'язування або перенаправлення їх усіх до одного URL.
Типовий контент, що використовується на цих сторінках, схожий на цей:

Приклад doorway page.
З нашої точки зору, це архаїчна стратегія, яка в сучасному SEO коштувала б більше зусиль, ніж результатів, і, звісно, є thin content.
Як thin content впливає на вебсайт?
Маємо уточнити, що thin content зазвичай карається на вебсайтах, які занадто деоптимізовані, що представляють структурний і контентний хаос, який навіть Google не здатний ідентифікувати, або тих, чия побудова обрала «легкий» шлях завдяки використанню деяких (або багатьох) технік black hat.
Основний недолік генерації thin content на вебсайті в тому, що він піддає себе ризику бути жорстко покараним Google, не даючи йому досягти хороших позицій у SERP або спричиняючи постійне падіння позиції.
Але це не єдиний недолік, оскільки якщо вебсайту вдається отримувати відвідування з будь-якого каналу, буде складно утримати й переконати відвідувачів взаємодіяти. У ситуації, у якій SEO зараз перебуває, де відвідувач є головним, цей факт призведе до зростаючої втрати авторитету.
Як виявити thin content за допомогою Safecont
Після всього, що ви вже знали, і після прочитання всього цього, напевно ви не хочете, щоб ваш вебсайт мав хоч трохи непотрібного контенту. Як ми щойно вам сказали, якщо у вас є якісна контент-стратегія і ваш вебсайт презентує відповідний рівень оптимізації, не маєте хвилюватися, але ми рекомендуємо тримати під контролем такий тип сторінок, особливо через відвідувачів, які можуть на них потрапити.
З цієї причини ми вважаємо дуже доречним поговорити про один з інструментів, які найкраще працюють у нашій агенції; ми хочемо, щоб ви з ним познайомилися, на випадок, якщо, як і нам, він стане вам у нагоді у ваших контент-аудитах.
Скажемо вам, для тих, хто його не знає, що Safecont — це іспанський інструмент, спеціалізований на аналізі контенту й архітектури, що використовує технологію Machine Learning для виявлення, де знаходяться основні проблеми вебсайту. З ним ми можемо виявляти низькоякісний контент, що може призвести до санкцій та інших проблем.
Оскільки головна тема статті — thin content, ми зосередимося виключно на аналізі, який інструмент проводить щодо нього. Коли вебсайт просканований, у першій інстанції, у резюме сканування ми вже знаходимо кількість URL, що представляють цю проблему.

Загальний вигляд дашборда SEO-інструменту Safecont.
Якщо заглибимось у конкретний аналіз…

Функція виявлення thin content — одна з найкращих особливостей інструменту.
Знаходимо дуже візуальний і дуже точний підсумок стану вебсайту.

Загальний вигляд кластерного аналізу SafeCont.
Перше, що, без сумніву, привертає нашу увагу, — це особливий графік у формі носорога (логотип інструменту, оскільки панда була б занадто очевидною), що показує нам відсоток ризику зазнати санкцій.

Графік ризику санкцій Safecont.
Згідно з цим аналізом, вебсайт відповідає оптимальному рівню thin content, і наразі Google не має причин їх карати. Нижче цього аналізу ми бачимо дуже цікаву й репрезентативну таблицю та графік, що дозволяють отримати загальний погляд на стан вебсайту:

Аналіз thin content через кластери.
Таблиця показує нам три колонки:
- Links: що надає, в інтервалах по 10, відсоток thin content, який можуть мати сторінки.
- Pages: кількість сторінок, що представляють кожен відсоток thin content.
- Cluster Risk: ймовірність того, що кожна зі сторінок у межах кожного інтервалу буде покарана.
Знаємо, що в такому вигляді це може здатися трохи заплутаним, але правильний спосіб інтерпретації був би таким: «Спостерігаємо, що більшість сторінок (706) представляють відсоток thin content між 10 і 20%, з середньою ймовірністю бути покараними у 29,81%.
Лише чотири сторінки мають відсоток thin content більше 40%, і ймовірність бути покараними становить 36,98%».
Графік це представляє, відрізняючи кожен інтервал кольорами, де зелений — це той з найнижчим відсотком thin content, а червоний — той з найвищим. Саме тому другий інтервал (10%-20%) представлений найбільшою товщиною.
І, нарешті…

Індивідуалізований аналіз URL (thin content, ризик санкцій…)
…Safecont показує нам індивідуальний аналіз кожного URL, що дозволяє нам фільтрувати на свій смак. Поряд з URL з'являються 3 точки даних:
- ThinRatio: відсоток подібних слів усередині тієї ж сторінки
- NUMWORDS: щільність слів, що включені в контент
- PAGERISK: ймовірність того, що сторінка може бути покарана.
Як ми сказали по всій статті, ми не можемо зосереджуватися виключно на довжині контенту, як інструмент зосереджується в цій останній частині. Однак це те, що ми маємо тримати в пам'яті.
Цей інструмент треба розуміти глобально, оскільки він дозволить нам проводити дуже якісні контент-аудити. Ми наполегливо рекомендуємо вам спробувати.
** Примітка: ця стаття не була проспонсорована, але ми справді віримо, що Safecont приносить цінність і має велику якість, тому вважаємо доречним поділитися нею з SEO-спільнотою.*
Автор: David Kaufmann

Останні 10+ років я повністю занурений у SEO — і чесно кажучи, не хотів би інакше.
Моя кар'єра вийшла на новий рівень, коли я працював старшим SEO-спеціалістом у Chess.com — одному зі 100 найвідвідуваніших сайтів у всьому інтернеті. Робота в такому масштабі навчила мене того, чого не дав би жоден курс чи сертифікат.
З цього досвіду я заснував SEO Alive — агенцію для брендів, які серйозно ставляться до органічного зростання. І оскільки не знайшов інструмента, що добре справляється з обома світами — класичним і AI, побудував SEOcrawl. Якщо ви шукаєте досвідченого SEO-партнера, який любить цю справу — буду радий поговорити!
Дізнайтесь більше контенту цього автора

