Orphan Pages: що це таке і як їх знайти

Orphan Pages: що це таке і як їх знайти
David Kaufmann
Уроки SEO
11 min read

Щоб сайт працював і міг показувати сторінки, які він містить, аби відвідувачі могли їх переглядати, він повинен мати правильну структуру посилань, що допомагає, по-перше, відвідувачам дістатися цих сторінок одним кліком, а також забезпечує їх сканування ботами та павуками Google, щоб вони з'явилися в результатах пошуку. Коли сторінка не інтегрована в структуру посилань, її називають «orphan page» (сторінка-сирота).

Але що саме таке orphan page? Розглянемо цей термін детально, разом з наслідками, які він може мати з SEO-перспективи, чому це трапляється, як знаходити такі сторінки і як вирішити проблеми, які вони можуть спричинити. Поїхали!

Що таке orphan pages?

А саме, orphan page — це сторінка на сайті, яка, попри те, що може бути або не бути проіндексованою Google чи іншою пошуковою системою, не з'єднується і не посилається на структуру сторінок платформи, стаючи повністю ізольованою.

Так ця сторінка ніби «плаває» на сайті, не будучи доступною для відвідувачів, які могли б її відвідати, або для ботів Google для показу в результаті пошуку, навіть якщо вона проіндексована. Навіть якщо сторінка представлена в XML sitemap з відповідним URL, немає гарантії, що orphan pages не існують, бо з якоїсь причини або людської помилки до неї не може дістатися ані відвідувач, ані краулери пошукових систем.

що таке orphan pages
що таке orphan pages

Наприклад, є два способи, якими виявляються сторінки на сайті:

  • через краулер, що знаходить усі сторінки, переходячи за посиланнями між ними, і

  • через перелік URL у XML sitemap.

Коли існує ізольована orphan page, вона ніби невидима, навіть якщо вона в sitemap, бо оскільки на неї не вказують посилання, її не знаходять.

Це викликає низку проблем щодо:

  • трафіку

  • втрати потенціалу

  • SEO-проблем

  • видимості

  • авторитету і

  • можливих штрафів

…серед інших, які ми обговоримо детально пізніше. Поки що зрозуміло одне: потенційні orphan pages, незалежно від розміру сайту, мають бути виправлені, що можливо і є звичайною практикою обслуговування.

Чому трапляється, що сайт має orphan pages?

Є кілька причин, чому сайт має orphan pages, навіть без того, щоб власник чи розробник був про це обізнаний або знав у якийсь момент. Часто такі типи сторінок, які небажані на веб-платформі, з'являються через зміни, виконані погано, що зазвичай спричинено людською помилкою.

Нижче ми показуємо основні сценарії, у яких генеруються або з'являються orphan pages на сайті:

  • Іноді внутрішня перелінковка сторінок сайту змінюється, що призводить до видалення деяких URL, оскільки вони більше не потрібні, є старими або через оптимізацію сайту. Часто, навіть коли посилання видалено, сторінки залишаються на сайті, плаваючи й не будучи повністю видаленими.

  • Сторінки A/B-тестування, з якими кінцевий користувач не контактує, які після використання в розробці сайту залишаються там, не будучи видаленими.

  • Коли тимчасово генерується лендінг для залучення відвідувачів стати клієнтами сайту, як-от під час промо, Різдва тощо, і після того, як цей час пройшов, сторінка видаляється, але індексований URL залишається.

  • Коли категорію видаляють із меню сайту, але її не перенаправляють належним чином на іншу, створену на її місці, залишаючи решту сторінки без посилань на платформі.

  • Під час міграції сайту часто генерується багато orphan pages, що змінюють формат, URL і параметри, але не видаляються і стають від'єднаними та ізольованими від сайту.

  • Коли використовують шаблон для побудови сайту, і залишаються сторінки шаблону за замовчуванням, про які потім забувають і не видаляють.

З іншого боку, є дві поширені причини orphan pages, які потрібно вирішувати негайно; це по суті дубльовані сторінки, які мають послідовно перенаправлятися автоматично на єдиний URL. А саме, ми говоримо про послідовне використання HTTPS і HTTP на канонічних і неканонічних сторінках, а також використання trailing slashes.

Інакше, ймовірно, що деякі версії сторінки не пов'язані і, як наслідок, стають сиротами. У цьому випадку те, що вони сироти, не основна проблема, а швидше те, що вони дубльовані і збираються спричинити проблеми зі штрафами або втратою індексації, серед інших, що в Google перекладається як скопійований чи низькоякісний контент. Ми розглянемо це пізніше в розділі про вирішення orphan pages.

Чи приносять orphan pages користь або шкоду SEO?

Orphan pages становлять проблему з SEO-погляду, а також для видимості, авторитету, втрати контенту й трафіку, залежно від кількості тих, що існують на платформі. Тобто наявність на платформі однієї, двох чи кількох orphan pages може не спричиняти жодної проблеми, але коли вони складають великий відсоток сайту, ось де починаються проблеми.

Оптимізація сайту так, щоб у нього не було orphan pages, важлива для SEO та інших аспектів, і ніколи не можна сказати, що вони приносять сайту користь; навпаки, вони шкодять, коли їх занадто багато.

По-перше, пошукові системи не можуть знайти orphan pages через посилання, тож orphan pages часто не індексуються і ніколи не з'являються в результатах пошуку, що впливає на їхній трафік, видимість і потенціал, але про це детальніше пізніше у власному розділі.

Загальні проблеми, спричинені orphan pages

Нижче — деякі загальні проблеми, спричинені orphan pages, особливо коли вони покривають значну частину структури посилань і URL сайту:

  • Користувацький досвід: orphan pages, наскільки б це не здавалося неочевидним, дуже впливають на користувацький досвід сайту, оскільки відвідувачі не можуть природно відвідати сторінку через меню чи посилання, що приведе їх до того, що вони шукають, навіть якщо сторінка існує і має якісний контент.

  • Авторитет: якщо важливі сторінки стають сиротами і втрачають перелінковку з іншими URL на сайті, увесь авторитет, який вони могли мати, марнується, і це безпосередньо впливає на ранжування в результатах пошуку Google, оскільки це важливий SEO-фактор у тому, як пошукова система впорядковує результати за конкретним ключовим словом.

  • Контекст: внутрішня перелінковка сайту дає краулерам Google контекст, як індексувати сторінку і для яких пошуків вона важлива та релевантна. Orphan pages призводять до того, що сайт і самі сторінки втрачають контекст і семантичне значення, у разі якщо вони проіндексовані.

Однак коли orphan pages присутні у великих кількостях, їх вплив набагато помітніший у плані ранжування, трафіку та сканування, тож це проблеми, які потрібно вирішувати окремо й більш розгорнуто.

Проблема сторінки з низькою видимістю та трафіком

Orphan pages мають помітний негативний вплив, коли йдеться безпосередньо про ранжування або позиціонування сайту й конкретної ураженої сторінки, а також її трафіку. І це тому, що, як згадано раніше, orphan page ізольована і стає невидимою, як для відвідувача, який не може природно знайти її на сайті через кнопку чи клік, так і для краулерів Google або інших пошукових систем.

Це чітко впливає на трафік сайту і сторінки, а також на її видимість, оскільки не отримує багато відвідувачів і також через погане або неіснуюче місце, яке orphan pages мають у результатах пошуку. Як наслідок, маємо справу з повною втратою потенціалу для сайту й сторінки, особливо якщо вона включає якісний контент про продукти, послуги та інші теми. Вплив на трафік і видимість також спричиняє втрату авторитету й релевантності для сайту щодо його ніші чи галузі порівняно з конкурентами.

Проблема втрати сканування

Google як пошукова система індексує сторінки сайту відповідно до того, що відоме як бюджет сканування або Crawl Budget, що можна описати як час, який краулери чи павуки пошукової системи витратять на пошук сторінок для індексації. Чим більше сторінок має сайт, тим більше часу він вимагатиме, тобто більше crawl budget.

Тут вступає в гру оптимізація структури сайту, архітектури та інших елементів, як-от orphan pages. Якщо в сайту є нерелевантні orphan pages, він однаково споживатиме crawl budget, який марнується і може призвести до того, що сторінки з гарним станом і контентом не індексуватимуться, що впливає на результати пошуку та трафік. Коротко, orphan pages представляють марнування ресурсів, яке Google не готовий витрачати.

Різниця між orphan pages та Dead End сторінками

Коли йдеться про SEO, термін orphan page** можна переплутати з терміном dead end page або «Dead End»**, оскільки вони представляють подібні проблеми, але це не одне й те саме. Ми вже визначили раніше, що таке Orphan Pages, перейдемо до dead ends:

Dead end page — це сторінка, що не пов'язана з жодною іншою з внутрішньої перелінковки сайту, ані з якоюсь іншою зовнішньою веб-платформою, тобто, потрапивши на неї, ви не можете нічого зробити, окрім як закрити її та піти.

Коли краулери пошукової системи на кшталт Google потрапляють на dead end page, їм нікуди йти, і звідси походить її назва, що проводить аналогію з тупиковою вулицею.

Як знайти orphan pages на вашому сайті?

Щоб почати вирішувати проблеми, пов'язані з orphan pages або Orphan Pages, перше, що потрібно зробити, — знайти їх, оскільки очевидно, що вони не показуються з першого погляду ані як відвідувачу сайту, ані як розробнику. На щастя, можна використовувати різні інструменти, як-от SEO-програмне забезпечення, що детально аналізують всю структуру нашого сайту, отримуючи через логи сервера повну картину всіх них.

Якщо вам потрібне потужне SEO-програмне забезпечення, що допомагає не лише знайти orphan pages, а й посилити та покращити вашу SEO-стратегію, не вагайтеся подивитися на власноруч розроблену програму SEO Alive!

Розпізнавання orphan pages зі Screaming Frog

Як ми згадували, на ринку є кілька програм, що допомагають ідентифікувати ці orphan pages; ми зосередимося на простому поясненні, як це зробити з однією з найвідоміших — Screaming Frog.

Screaming Frog має дві різні програми: ту, що найбільш відома всім, яка сканує весь сайт, переходячи за внутрішніми посиланнями, які знаходить, і log analyser, що аналізує логи доступу сервера, тобто записи, що залишаються, коли Googlebot (або інший user agent) заходить відвідати якусь з наших сторінок.

З першою ми витягнемо файл, що перелічує загальні URL, які краулер знаходить під час навігації; це буде Excel-файл, який можна знайти в розділі звітів під «all inlinks»:

як знайти orphan pages
як знайти orphan pages

Тож, отримавши цей файл, беремо логи з нашого сервера, що зазвичай буде стиснутим файлом згаданих записів, і завантажуємо його в log analyser Screaming Frog, щоб тут у нас була панель, де з'являться всі URL, які Googlebot відвідав протягом завантаженого періоду часу, незалежно від того, чи вони пов'язані, чи ні.

Останнім кроком буде завантажити Excel-файл з попереднього кроку до увімкненого розділу log analyser для цієї мети, і коли ми це зробимо, увімкнеться нова вкладка з такими опціями:

orphan pages log analyser
orphan pages log analyser

  • Matched with URL data: це буде набір URL, які внутрішньо пов'язані і їх відвідав Google.

  • Not in log file: ті URL, що пов'язані, але з якоїсь причини не отримують подій (відвідувань) від Google.

  • Not in URL data: це група, яка нас цікавить у цьому випадку; це URL, які Google відвідує, залишаючи запис у логах, але які краулер не зміг знайти при симуляції, бо вони не внутрішньо пов'язані, тобто це наші шукані Orphan Pages.

З цієї третьої групи ми витягнемо перелік сторінок, які каталогізуємо як сироти, причому ті, що повертають код статусу 200, в основному є об'єктом нашої оптимізації.

Як вирішити проблему orphan pages?

Загалом і вручну, є чотири речі, які можна зробити, якщо у вас є URL, не інтегровані у внутрішню перелінковку, де треба ухвалити певні рішення:

  • По-перше, якщо після міграції є orphan pages, як ймовірно й буде, і вони переглянуті, і багато з них мають мало релевантного, ніякого або дубльованого контенту, найкраще їх видалити і, де доречно, додати 301 перенаправлення на схожі або виділені сторінки сайту з більшим авторитетом.

  • По-друге, якщо з якоїсь причини ви хочете зберегти orphan page через гарний контент, авторитет і трафік, наступний крок — зв'язати її з URL сайту, що має пов'язаний контент, і який легко досяжний для відвідувачів і Google. Звісно, варто зазначити, що URL сторінки має бути включений у sitemap.

  • По-третє, якщо з'являється багато orphan pages, але їх природа тимчасова і їх контент уже застарів, оскільки включав акції та контент, пов'язаний з конкретним часом, зробімо те саме, що й у попередньому кроці, і пов'яжемо сторінку з іншою внутрішньою з релевантністю та доступною. Однак у цьому випадку ми робимо так, щоб цей URL не індексувався, включаючи мета-тег "noindex", щоб краулери не враховували його.

  • Нарешті, у випадку orphan pages з дубльованим або майже дубльованим контентом, варто було б розглянути видалення тієї сторінки і включення контенту в іншу, щоб не втратити його і продовжувати використовувати його загальний потенціал.

Висновок

Orphan pages — природний елемент, що з'являтиметься на сайті з різних причин, і коли їх не надмірно або їх кількість не зростає експоненційно, вони не становлять жодної проблеми.

З іншого боку, коли великий відсоток сайту і його внутрішньої перелінковки складається зі сторінок такого типу, це може генерувати багато проблем щодо сканування, ранжування й трафіку, пов'язаних з SEO, а також авторитету, користувацького досвіду та інших проблем, які потрібно вирішувати.

Хороша новина — orphan pages можна вирішити різними способами, але завжди в процесі аналізу: маєте поставити собі питання, чи кожна конкретна orphan page релевантна для ранжування, для контенту, і чи можна її пов'язати з іншою, а коли це не так, просто видаляйте їх.

А ви, дорогий читачу… чи знали ви про існування orphan pages? Чи стикалися з цим елементом у своїх проєктах або проєктах ваших клієнтів? Залиште нам коментар, і ми вам відповімо. Дуже дякуємо і до зустрічі!

Автор: David Kaufmann

David Kaufmann

Останні 10+ років я повністю занурений у SEO — і чесно кажучи, не хотів би інакше.

Моя кар'єра вийшла на новий рівень, коли я працював старшим SEO-спеціалістом у Chess.com — одному зі 100 найвідвідуваніших сайтів у всьому інтернеті. Робота в такому масштабі навчила мене того, чого не дав би жоден курс чи сертифікат.

З цього досвіду я заснував SEO Alive — агенцію для брендів, які серйозно ставляться до органічного зростання. І оскільки не знайшов інструмента, що добре справляється з обома світами — класичним і AI, побудував SEOcrawl. Якщо ви шукаєте досвідченого SEO-партнера, який любить цю справу — буду радий поговорити!

→ Читайте всі статті від David
Більше статей: David Kaufmann

Дізнайтесь більше контенту цього автора