ウェブサイトのサイトマップの見つけ方

どのウェブサイトのサイトマップを見つけるのも比較的簡単で、ここではそのミッションを達成するお手伝いをします。まずは最も一般的なサイトマップ形式であるXMLから始め、その後いくつかの他の形式も取り上げます。まずは基本から始めましょう。
サイトマップとは?
XMLサイトマップとは、さまざまな検索エンジンを支援することを目的とした、ウェブサイトのページ一覧です。ウェブサイト上のページ、動画、画像、ファイルなどのURLや、それらの関係性に関する重要な情報を提供します。ページとともに、XMLサイトマップには各URLに関する追加のメタデータも含まれます:
- 最終更新日- どれくらいの頻度で変更されるか- 他のページと比較した優先度。
SEOのベストプラクティスに関して言えば、サイトマップはインデックス可能で質の高いコンテンツのみを含むように最適化されるべきです。その中にリンク切れ(404)、リダイレクト、重複ページがあると、検索エンジンを混乱させる可能性があります。
サイトマップはウェブサイトのアウトラインのようなものです。コード形式で構築されており、通常は次のように見えます:

あるいはこのように:

なぜサイトマップを見つける必要があるのか?
サイトマップの基本と主な目的については既に説明しました。それでは、そもそもなぜこれらのファイルを見つけたいのかを見ていきましょう。
上記で議論したように、サイトマップは検索エンジン、特にそのクローラー(例:Googlebot)にウェブサイト上の重要なコンテンツを知らせるためのかけがえのない、シンプルな方法です。
まず第一に、そもそもXMLサイトマップが存在するかどうかを確認したいと思うかもしれません。もし存在するなら、次のステップはそれを検査して、適切に作成され、正しい情報を含んでいるかを確認することです。
最後に、サイトマップがない場合、作成して検索エンジンに送信したいかもしれません。XMLサイトマップは決して必須ではないことに注意してください。それでも、新しいウェブサイトやページを発見し、インデックスし、最終的にランキング付けするのをより速く行うのに役立ちます。
さて、探偵の仕事に深く飛び込み、それらのサイトマップを見つける時が来ました!
準備はいいですか?さあ行きましょう!
サイトマップを見つけるシンプルな方法
ウェブサイトのサイトマップを見つけるための最も簡単な方法のいくつかから旅を始めましょう。
1) 一般的なXMLサイトマップの場所を手動で確認する
ウェブサイトのXMLサイトマップを見つけるための最も一般的(かつシンプル)な方法の1つは、 いくつかの標準的な場所を手動で確認することです。これは非常に簡単で、ブラウザにウェブサイトのURLを入力し、いくつかの異なるバリエーションを試すだけです。見てみましょう:
これが最も人気のある場所ですが、唯一の場所ではありません。したがって、最初の試みで運が良くなかった場合は、試すべきクイックチェックがさらにいくつかあります:
- /sitemap_index.xml(これはウェブサイトが複数のサイトマップを持っている場合の、すべてのサイトマップのインデックスです)。
これはこのブログの私たち自身のXML サイトマップの場合です。見てみましょう:

そしてこれが見た目です:

基本的に、これらはすべて含まれている投稿の種類によって分割された個別のサイトマップです。
さて、まだ運が悪い場合は、さらにいくつかのオプションを試してみましょう:
- /sitemap-index.xml- /sitemap.php- /sitemap.txt- /sitemap.xml.gz- /sitemap/- /sitemap/sitemap.xml- /sitemapindex.xml- /sitemap/index.xml- /sitemap1.xml
注意:XMLファイルはサイトマップを記述する方法の1つに過ぎません。RSSやAtom形式もあります。
したがって、サイトマップの可能性のある場所をさらにいくつか追加する必要があります:
- /rss/- /rss.xml- /atom.xml
これらについては後でもっと話します。
確認のために- さまざまな代替案を試しながら、「/」の前にウェブサイトのドメイン名を置く必要があります。
2) Robots.txtファイルを確認する
まだ私たちと一緒にいるなら、それはこの記事の主な目的であるファイルを見つけることに失敗したか、単にもっと学ぶことに興味と情熱を持っているかのどちらかを意味します。
実のところ、正確な理由が何であれ、良いニュースがあります - 別の非常にシンプルなヒントで旅を続けます。
Robots.txtは、SEO担当者(そしてプログラマーも)に知られている特別なファイルで、検索エンジンクローラーに有用なディレクティブを提供します。さらに、ここはウェブサイトのサイトマップへのリンクを見つけることが非常によくできる場所でもあります。
検索エンジンがこれらのrobots.txtファイルを訪問するので、そこにサイトマップへのリンクを追加することは完全に理にかなっているという考え方です。そうすれば、そもそもサイトマップを検出し、ウェブサイトをクロールするのが容易になります。
もう一つの良いニュースを聞く準備はできていますか?!ここにあります- ウェブサイトのrobots.txtファイルにアクセスするには、ブラウザでドメイン名に*/robots.txt*を追加して「Enter」を押すだけです。これは、さまざまな可能なサイトマップルートを追加していた前のステップと似ています。
実際の例ほどうまくいくものはありません。私たち自身のrobots.txtファイルのURLアドレスをご覧ください:
https://seocrawl.com/robots.txt
これは小さいながらも、いくつかの重要な機能を持ったシンプルで便利なファイルです。既にそれを開いている場合、あなたが探している小さな宝石 - サイトマップファイルをほぼ即座に見ることができます:

ほら!簡単だと約束しましたよ :)
3) Google Search Consoleを確認する
さて、まだサイトマップが見つからない?問題ありません!私たちには道を見つけるのに役立つもっと多くのヒントがあります。
別の簡単で素早い方法をお見せしましょう。
Google Search Console(以前はWebmaster Toolsとしても知られていました)は、探しているパスを見つけるためのもう一つの場所です。もちろん、これが可能であるためには、あなたがウェブサイトの所有者であるか、アクセス権を付与されている必要があります。
これらの基準のいずれかを満たしている場合、次のステップはGSCにログインし、左側のメニューからサイトマップを選択することです:

さて、サイトマップ(またはサイトマップ群)が過去に誰かによって既に送信されている場合、すぐにそれを見ることができます:

サイトマップの正確なURLアドレスに加えて、サイトマップの種類(他のサイトマップを含むインデックスファイルか、ウェブサイトのページを含む通常のサイトマップか)、いつ送信されたか、最後に読み込まれた時、ステータス、そして中にいくつのURLがあるかなどの追加情報があります。
ヒント:SEOと有機的なウェブサイトのパフォーマンスの改善に本気で取り組んでいるなら、Google Search Consoleは必須のツールです。そこから得られるインサイトは数多くあります。
さらに、追加のボーナスとして、GSCを持っていると私たちの強力なツール- SEOcrawlを試すことができます
4) Bing Webmaster Toolsを確認する
良いニュースは、Bing Webmaster ToolsはGoogle Search Consoleとほぼ同じように機能するということです。後者が以前Google Webmaster Toolsと呼ばれていたのも驚くことではなく、多くの共通点があります。
再度、ログインしてから左側のサイドバーに移動する必要があり、そこに「サイトマップ」セクションがあります。

それをクリックし、既にサイトマップ/サイトマップ群が送信されていた場合、それらをさらに探索することができます。

サイトマップを見つける高度な方法
まだ私たちと一緒ですか?わかりました、それはあなたがまだその貴重なサイトマップファイルの場所を探しているか、あるいは上級セクションに入るのにとても勇敢かのどちらかを意味します。どちらの場合でも、ここまで到達したあなたを祝福し、幸運を祈りたいと思います :)
そんなに複雑で怖いものではないことを約束します!さあ行きましょう!
5) Google検索演算子を使用する
Google検索演算子(コマンドとしても知られる)は、さまざまなSEOの目標(例:リンク構築の機会を見つける、コンテンツのアイデア、技術的な問題の発見など)に対して非常に強力である可能性があります。しかし、この場合、私たちは調査しているウェブサイトのXMLサイトマップを見つけるためにそれらを使用します。
そのために、「filetype:」コマンドを活用する必要があります。これを「site:」コマンドと組み合わせると非常に便利です。基本的に、両方の組み合わせは、私たちが望むウェブサイトでのみ特定のファイルタイプを探します。
例:site:chess.com filetype:xml
そして、この検索がGoogleで表示するものは次のとおりです:

これでできました!ウェブサイトのすべてのインデックス付きサイトマップがGoogleで表示され、さらに探索できます。
関連性のない結果が表示される場合は、検索をさらに絞り込むことができます。今回は武器に「inurl」演算子を追加します。
例:site:uefa.com filetype:xml inurl:sitemap

注意:上記で述べたように、サイトマップはテキストファイルである可能性もあります。それらを見つけるには、異なる拡張子で同様の検索を行うことができます。
例:site:WebsiteURL inurl:sitemap filetype:txt
そして、これは次の結果になります:

ヒント:これらのコマンドは、Googleによってインデックスされている場合のみサイトマップの場所を明らかにします。サイトマップを自動的に作成するWPプラグインの中には、サイトマップにno follow, no indexタグを追加するものがあります。そのため、結果が見つからなかった場合でも心配しないでください!
次のアイデアに進みましょう。

6) オンラインツールを使用する
別のテクニックは、SEO Site Checkupのようなオンラインツールを試すことで、ウェブサイトのURLを貼り付けてCheckupを押すだけです。すると、このようなものが得られます:注意:このツールの動作方法は、前述の標準的なサイトマップの場所(sitemap.xml, sitemap1.xml, sitemapindex.xmlなど)を確認することです。したがって、他の特定のケースでは、あなたのウェブサイトを見つけられない可能性があります。
7) ウェブサイトのCMSを確認する
サイトが動作しているコンテンツ管理システムによって、XMLサイトマップは異なる場所に配置されている可能性があります。良いニュースは、最も人気のあるCMSには検索を開始したいデフォルトの場所があるということです。
まず、ウェブサイトのCMSを特定する必要があります。これはかなり簡単なプロセスで、オンラインツールまたはブラウザ拡張機能の両方を使用できます。
例えば、便利なアドオンの1つはBuilt Withで、CMSだけでなく、ウェブサイトが使用しているより多くのソフトウェアやプログラムを識別します。あなたが探している情報を表示する方法は次のとおりです:

オンラインツールを好む場合、可能な解決策の1つはWhatCMSです:

代替案はCMS Detectです:

さて、正確なCMSがわかったので、最も人気のあるコンテンツ管理システムのいくつかと、通常XMLファイルをどこに保管するかを探索してみましょう。
Wordpress
2020年以前は、サイトマップは主にプラグインを介して作成されていました。しかし、現在では、WPの組み込み機能により、/wp-sitemap.xmlに配置されるはずです。
それでも、調査しているウェブサイトがサイトマップの作成にプラグインを使用している場合、以下のいくつかの場所を試すことができます:
- /sitemap.xml- /tag-sitemap.xml- /sitemap_index/xml- /category-sitemap.xml
あるいは、プラグインの設定を確認し、そこでパスを見つけることができます。
Wix, Shopify, Joomla, Squarespace, Magento
良いニュースは、これらすべてがユーザーのためにXMLサイトマップを自動的に生成することです。 したがって、デフォルトの場所(追加で変更されていない場合)は: /sitemap.xml
「/」部分の前にドメイン名が来ることに注意してください。
ボーナス:Sitemap.xmlを即座に発見するためのブックマークレット
あなたが生産性のファンであり、すべての小さなタスクから時間を節約することを好むなら(私たちSEO担当者は皆そうではないでしょうか?!)、ウェブサイトのXMLサイトマップを即座にチェックするための便利なクイックブックマークレットが役に立つかもしれません。
あなたが必要なのは、このjavascriptコードを追加することだけです:
javascript:void(location.href='http://' + location.host + '/sitemap.xml')
それをブックマークすると、クリックするたびに、デフォルトの/sitemap.xmlの場所にある場合、サイトマップファイルが開きます。
素早く、簡単に!
他のタイプのサイトマップを見つける
私たちは主にXMLサイトマップについて話しましたが、それはあなたのドメインで何が起こっているかをクローラーに示す最も一般的な形式だからです。それでも、一部のウェブサイトで見つけることができる他のタイプについても言及する価値があります。
- HTML。これらは通常ユーザーを楽にするために作られており、特に大規模なウェブサイトにとって非常に役立ちます。
例えば、Ebayは訪問者に主要なページとカテゴリーを含む仮想的な「マップ」を提供しています:https://pages.ebay.com/sitemap.html

-
RSS。場合によっては、ウェブサイトはサイトマップとしてRSSフィードを使用し、通常は次の場所にあります:/rss/ または /rss.xml。
-
Atom。同じことがAtomフィードにも当てはまり、通常は次のように見つけることができます:/atom.xml- TXT。これは既に議論したそのような例の標準的なテキストファイルです。場所:/sitemap.txt
サイトマップがない?この場合どうすればいい?
サイトマップを見つけるためのさまざまなオプションを検討した後、既にサイトマップが作成されていない場合に何をすべきかについて少し言及するのが良いでしょう。これは、短期間オンラインにしかなっていないほとんどの新しいウェブサイトの場合です。または、非常に小さく、ちっぽけなサイトの場合です。
また、すべてのウェブサイトがサイトマップを必要とするわけではないことも考慮してください。ウェブサイトのページが数ページしかない場合、それなしでも大丈夫でしょう。
それでも、XMLサイトマップを作成したい場合は、CMSシステムと互換性のあるプラグインを単に使用できます。WPの良い例をいくつか挙げます:
- Rank Math Sitemap Plugin- WP Sitemap Plugin- Google XML Sitemaps- WordPress SEO by Yoast
あるいは、サイトマップを手動で作成するか、クローラーを使用してウェブサイト全体を調べてアップロード用のサイトマップをエクスポートすることもできます。
まとめ:
これらのヒントが、サイトマップの世界を深く掘り下げるのに役立ち、それらがどのように機能するか、なぜそれらが必要か... そしてもちろんどうやってそれらを見つけるかについて、より詳しくなったことを願っています。
他に知りたいことがあれば、または単にあなたの経験を共有するために、コメントでお知らせください :)
幸運を祈ります!
著者: Ognian Mikov

SEOとの出会いは2012年で、それ以来ずっと夢中になっています。私にとってSEOは単なる仕事ではなく、情熱であり趣味でもあり、常に学び続け、成長しようという意欲を与えてくれる存在です。新しいトピックをリサーチしているときも、コンテンツを作っているときも、テクニカルな改善に没頭しているときも、デジタルマーケティングの奥深い世界と、ウェブサイトのパフォーマンスを高めるために存在する無数の可能性に、いつも心を惹かれています。
2021年には、初めてのフルリモート企業となったSEO AliveとSEOcrawlにジョインし、新しいスキルを身につけながら、刺激的なプロジェクトに携わってきました。そして何より、素晴らしい仲間と出会い、多くを学び、その多くが今では友人と呼べる存在になったことが、私にとって一番の財産です。
学歴はMarketingの学士号と、PR & Advertisingの修士号を取得しています。休日は娘と過ごす時間を大切にしながら、チェス、サッカー(Само Левски & Més que un club)、ポーカーをプレーしたり観戦したりして楽しんでいます。
この著者の他のコンテンツをご覧ください
