Як знайти sitemap сайту

Як знайти sitemap сайту
Ognian Mikov
Уроки SEO
10 min read

Знайти sitemap будь-якого сайту відносно легко, і тут ми допоможемо вам виконати цю місію. Почнемо з найпоширенішого формату sitemap — XML, а потім охопимо ще декілька. Спочатку — основи.

Що таке Sitemap?

XML sitemap — це список сторінок сайту, спрямований на допомогу різним пошуковикам. Він надає важливу інформацію про URL вашого сайту, включно зі сторінками, відео, зображеннями, файлами та їхніми зв'язками. Поряд зі сторінками XML sitemap також містить додаткові метадані про кожен URL:

  • дата останнього оновлення - як часто він змінюється і - його пріоритет порівняно з іншими сторінками.

Коли йдеться про best practices SEO, sitemap треба оптимізувати, щоб включити лише індексований і якісний контент. Будь-яка зламана (404), перенаправляюча або дублікована сторінка всередині нього може заплутати пошуковики.

Sitemap — це наче схема сайту. Він побудований у форматі коду й зазвичай виглядає так:

Sitemap SEOcrawl
Sitemap SEOcrawl

Або так:

Sitemap XML
Sitemap XML

Чому вам треба знаходити sitemap?

Ми вже охопили основи sitemaps, включно з їхньою основною метою. Тепер погляньмо, чому ми взагалі можемо хотіти знаходити ці файли.

Як ми обговорили вище, sitemaps — це незамінний і простий спосіб інформувати пошуковики, зокрема їхніх сканерів (наприклад, Googlebot), про важливий контент на нашому сайті.

Перш за все, можете перевірити, чи маєте ви взагалі XML sitemap. Якщо маєте, наступний крок — перевірити його та побачити, чи створений він правильно і чи містить правильну інформацію.

Нарешті, якщо у вас немає sitemap, ви можете створити його та надіслати пошуковикам. Зважте, що XML sitemaps жодним чином не є обов'язковими. Однак вони допомагають пошуковим сканерам знаходити, індексувати й зрештою ранжувати нові сайти та сторінки швидше.

Тепер настав час глибоко зануритись у детективну роботу та знайти ті sitemaps!

Готові? Поїхали!

Прості способи знайти ваш sitemap

Розпочнімо нашу подорож з деяких найпростіших способів знайти sitemap сайту.

1) Вручну перевірте поширені локації XML sitemap

Один з найпоширеніших (і простих) способів локалізувати XML sitemap сайту — вручну перевірити кілька стандартних локацій. Це до смішного просто, і все, що треба, — ввести URL вашого сайту у браузері й тоді спробувати кілька різних варіацій. Покажу вам:

Це найпопулярніша локація, але не єдина. Тому, якщо нам не пощастить з першою спробою, ось ще кілька швидких перевірок:

  • /sitemap_index.xml (це індекс усіх sitemaps у разі, якщо сайт має більше одного).

Це випадок з нашим власним XML sitemap у цьому блозі. Покажу вам:

URL del sitemap SEOcrawl
URL del sitemap SEOcrawl

А ось як він виглядає:

Listado de sitemaps de SEOcrawl
Listado de sitemaps de SEOcrawl

По суті, це всі окремі sitemaps, поділені за типом дописів, які мають усередині.

Тепер, якщо нам все ще не пощастило, спробуймо ще декілька опцій:

  • /sitemap-index.xml- /sitemap.php- /sitemap.txt- /sitemap.xml.gz- /sitemap/- /sitemap/sitemap.xml- /sitemapindex.xml- /sitemap/index.xml- /sitemap1.xml

Примітка: XML-файли — лише один зі способів описати sitemap. Існують також формати RSS та Atom.

Тому треба додати ще кілька можливих локацій sitemap:

  • /rss/- /rss.xml- /atom.xml

Поговоримо про них більше пізніше.

Просто щоб підтвердити: ставимо доменне ім'я сайтів перед "/", пробуючи різні альтернативи.

2) Перевірте файл Robots.txt

Якщо ви все ще з нами, це означає, що або вам не вдалося знайти файл, що є основною метою нашої статті, або ви просто допитливі та з пристрастю прагнете дізнатися більше.

Власне, незалежно від точної причини, у мене для вас хороші новини: продовжимо нашу подорож з ще однієї дуже простої поради.

Robots.txt — спеціальний файл, відомий SEO-фахівцям (та програмістам також), який надає корисні директиви пошуковим сканерам. Більше того, це також місце, де часто можна знайти посилання на sitemap сайту.

Ідея в тому, що оскільки пошуковики відвідують ці файли robots.txt, додавання посилання на sitemap там має ідеальний сенс. Так їм буде легше виявити sitemap з самого початку та сканувати сайт.

Ви готові до ще однієї хорошої новини?! Ось вона: щоб отримати доступ до файлу robots.txt сайту, треба просто додати /robots.txt до доменного імені у браузері та натиснути "Enter". Це подібно до попереднього кроку, де ми додавали різні можливі шляхи sitemap.

Що працює краще, ніж приклад з реального життя? Подивіться URL-адресу нашого власного файлу robots.txt:

https://seocrawl.com/robots.txt

Це маленький, але простий і корисний файл з кількома важливими функціями. Якщо ви вже відкрили його, майже миттєво зможете побачити маленький скарб, який шукаєте, — файл sitemap:

Robots seocrawl
Robots seocrawl

Voilà! Я ж обіцяв, що буде легко :)

3) Перевірте Google Search Console

Гаразд, sitemap все ще не знайдено? Жодних проблем! Маємо для вас більше порад, які допоможуть знайти шлях.

Покажу вам ще один легкий і швидкий спосіб.

Google Search Console (раніше відомий як Webmaster Tools) — це ще одне місце, щоб знайти потрібний нам шлях. Звісно, для цього треба бути власником сайту або мати наданий доступ.

Якщо ви відповідаєте одному з цих критеріїв, наступний крок — увійти в GSC і з меню зліва обрати Sitemaps:

Sitemaps в Google Search Console
Sitemaps в Google Search Console

Тепер, у разі якщо sitemap (або sitemaps) уже надіслано кимось у минулому, ви зможете побачити це одразу:

Submitted sitemaps
Submitted sitemaps

Поряд з точною URL-адресою sitemap є додаткова інформація як-от тип sitemap (індексні файли, що містять інші sitemaps всередині, або звичайні sitemaps зі сторінками сайту), коли його надіслано, остання дата перегляду, статус і скільки URL всередині.

ПОРАДА: якщо ви серйозно ставитесь до SEO та покращення продуктивності органіки сайту, Google Search Console — обов'язковий інструмент. Інсайти, які можна з нього отримати, численні.

Плюс додатковий бонус: наявність GSC дозволяє спробувати наш потужний інструмент SEOcrawl

4) Перевірте Bing Webmaster Tools

Хороша новина в тому, що Bing Webmaster Tools працює практично так само, як Google Search Console. Не дивно, що останній раніше називався Google Webmaster Tools, оскільки вони мають багато спільного.

Знову ж, треба увійти і потім перейти до лівої бічної панелі, де у вас буде доступний розділ "Sitemaps".

Sitemaps в Bing Webmaster Tools
Sitemaps в Bing Webmaster Tools

Натисніть на нього, і у разі, якщо sitemap/sitemaps уже були надіслані, ви зможете їх дослідити далі.

Submited sitemaps в Bing Webmaster Tools
Submited sitemaps в Bing Webmaster Tools

Просунуті способи знайти ваш sitemap

Ще з нами? Гаразд, це означає, що ви або все ще шукаєте те цінне місце розташування файлу sitemap, або ж ви достатньо хоробрі, щоб увійти в розділ для просунутих. У будь-якому випадку, я хочу привітати вас з тим, що дійшли так далеко, і побажати удачі :)

Обіцяю, що це не буде надто складно та страшно! Поїхали!

5) Використовуйте оператори пошуку Google

Оператори пошуку Google (також відомі як команди) можуть бути дуже потужними для різних SEO-цілей (наприклад, пошук можливостей лінкбілдингу, ідей контенту, виявлення технічних проблем тощо). Однак у цьому випадку ми використаємо їх, щоб знайти XML sitemap сайту, який досліджуємо.

Для цього треба скористатися командою "filetype:". Вона може бути справді корисною, коли ми поєднуємо її з командою "site:". По суті, поєднання обох шукатиме конкретні типи файлів лише на сайті, який ми хочемо.

Приклад: site:chess.com filetype:xml

А ось що цей пошук видасть у Google:

Використовуйте оператори пошуку Google для знаходження sitemaps
Використовуйте оператори пошуку Google для знаходження sitemaps

Ось маємо! Усі проіндексовані sitemaps сайту показані в Google, і ми можемо їх досліджувати далі.

Якщо з'являються деякі нерелевантні результати, можна ще більше уточнити пошук. Цього разу додамо до арсеналу оператор "inurl".

Наприклад: site:uefa.com filetype:xml inurl:sitemap

Оператор inurl для знаходження sitemaps
Оператор inurl для знаходження sitemaps

Примітка: як ми згадували вище, sitemaps також можуть бути текстовими файлами. Щоб знайти їх, можемо зробити подібний пошук, але з іншим розширенням.

Наприклад: site:WebsiteURL inurl:sitemap filetype:txt

І це призведе до такого:

Оператор filetype для знаходження sitemaps
Оператор filetype для знаходження sitemaps

ПОРАДА: ці команди розкриватимуть розташування sitemap лише якщо він проіндексований Google. Деякі WP-плагіни, що створюють sitemaps автоматично, додають тег no follow, no index до Sitemaps. Тож, якщо опинитесь без знайдених результатів, не хвилюйтесь!

Продовжимо з наступною ідеєю.

SEO Site checkup
SEO Site checkup

6) Використовуйте онлайн-інструмент

Інша техніка — спробувати онлайн-інструмент як-от SEO Site Checkup, де треба лише вставити URL вашого сайту й натиснути Checkup. Тоді отримаєте щось таке: Примітка: цей інструмент працює, перевіряючи стандартні локації sitemap, які ми згадували раніше (sitemap.xml, sitemap1.xml, sitemapindex.xml тощо). Тому він може не знайти ваш сайт у деяких специфічних випадках.

7) Перевірте CMS сайту

Залежно від системи керування контентом, на якій працює сайт, XML sitemaps можуть бути розташовані в різних місцях. Хороша новина в тому, що найпопулярніші CMS мають дефолтні локації, з яких можна почати пошук.

Спочатку треба ідентифікувати CMS сайту. Це досить простий процес, і можемо використати як онлайн-інструменти, так і браузерні розширення.

Наприклад, одне корисне доповнення — Built With, яке ідентифікує не лише CMS, а й багато інших програмних засобів, які використовує сайт. Ось як він відображає інформацію, яку ви шукаєте:

Доповнення Built With для ідентифікації CMS
Доповнення Built With для ідентифікації CMS

Якщо ви надаєте перевагу онлайн-інструменту, одне з можливих рішень — WhatCMS:

What CMS para SEOcrawl
What CMS para SEOcrawl

Альтернатива — CMS Detect:

CMS detect SEOcrawl
CMS detect SEOcrawl

Тепер, коли ми знаємо точну CMS, давайте дослідимо деякі з найпопулярніших систем керування контентом і де вони зазвичай зберігають XML-файли.

Wordpress

До 2020 року спосіб створення sitemaps був головним чином через плагіни. Однак сьогодні, з вбудованою функцією WP, вони мають бути розташовані за /wp-sitemap.xml.

Однак у разі, якщо сайт, який ви досліджуєте, використовує плагін для створення sitemap, можете спробувати деякі з таких локацій:

  • /sitemap.xml- /tag-sitemap.xml- /sitemap_index/xml- /category-sitemap.xml

Альтернативно, можете перевірити налаштування плагіна та знайти шлях там.

Wix, Shopify, Joomla, Squarespace, Magento

Хороша новина в тому, що всі вони автоматично генерують XML sitemaps для своїх користувачів. Тому дефолтна локація (якщо не змінена додатково) така: /sitemap.xml

Із зазначенням, що ім'я домену йде перед частиною "/".

БОНУС: Bookmarklet для миттєвого виявлення Sitemap.xml

Якщо ви фанат продуктивності й заощадження часу на кожному маленькому завданні (хіба не всі ми SEO-фахівці такі?!), тоді можете знайти корисний швидкий bookmarklet для миттєвої перевірки XML sitemap сайту.

Треба лише додати цей javascript-код:

javascript:void(location.href='http://' + location.host + '/sitemap.xml')

Зробіть закладку, і щоразу, коли натискатимете на неї, відкриватиметься файл Sitemap у разі, якщо він розташований у дефолтній локації /sitemap.xml.

Швидко й легко!

Знаходження інших типів sitemaps

Ми говорили головним чином про XML sitemaps, оскільки це найпоширеніший формат, щоб показувати сканерам, що відбувається на вашому домені. Однак варто згадати інші типи, які також можна знайти на деяких сайтах.

  • HTML. Зазвичай вони створені, щоб полегшити роботу користувачам, і дуже корисні особливо для більших сайтів.

Наприклад, Ebay надає своїм відвідувачам віртуальну "мапу" з основними сторінками й категоріями: https://pages.ebay.com/sitemap.html

Html sitemap
Html sitemap

  • RSS. У деяких випадках сайти використовують RSS-стрічку як sitemap, що зазвичай розташований за: /rss/ або /rss.xml.

  • Atom. Те саме стосується Atom-стрічки, і її зазвичай можна знайти як: /atom.xml - TXT. Це стандартний текстовий файл, як ми вже обговорювали один такий приклад. Локація: /sitemap.txt

Немає sitemap? Що робити в цьому випадку?

Пройшовши різні опції знаходження sitemap, варто сказати декілька слів про те, що робити, якщо sitemap ще не створено. Це буде випадок з більшістю абсолютно нових сайтів, що пробули онлайн короткий період. Або деяких дуже маленьких та крихітних сайтів.

Також зважте, що не всім сайтам потрібні sitemaps. Якщо сайт має лише декілька сторінок, ви чудово справитесь і без нього.

Однак, якщо хочете створити свій XML sitemap, можете просто скористатися плагіном, сумісним з вашою CMS-системою. Декілька гарних прикладів для WP:

  • Rank Math Sitemap Plugin- WP Sitemap Plugin- Google XML Sitemaps- WordPress SEO by Yoast

Альтернативно, можете створити sitemap вручну або використати сканер, щоб пройтися сайтом і експортувати sitemap для завантаження.

Підсумовуючи:

Сподіваюсь, ці поради допомогли вам глибше зануритись у світ Sitemaps, і ви тепер краще ознайомлені з тим, як вони працюють, чому ми їх потребуємо… і, звісно, як їх знаходити.

Дайте нам знати в коментарях, якщо є щось ще, про що хотіли б дізнатися, або просто поділіться своїм досвідом :)

Удачі!

Автор: Ognian Mikov

Ognian Mikov

SEO увійшло в моє життя у 2012 році, і відтоді я живу ним з повною увагою. SEO для мене — це більше, ніж просто робота — це пристрасть і хобі, які постійно мотивують мене вчитися й розвиватися. Чи досліджую я нову тему, чи створюю контент, чи занурююся в технічні виправлення — широкий світ digital-маркетингу та безмежні можливості покращити ефективність сайтів завжди мене захоплюють.

Маю бакалавра з маркетингу та магістра з PR і реклами. У вільний час люблю проводити час з донькою та грати або дивитися шахи й футбол (Само Левски та Més que un club) і покер.

→ Читайте всі статті від Ognian
Більше статей: Ognian Mikov

Дізнайтесь більше контенту цього автора