孤立ページ(Orphan Pages):とは何か、見つけ方

ウェブサイトが機能し、ユーザーが閲覧できるよう内部のページを表示するためには、 適切なリンク構造を備えている必要があります 。これによってまずユーザーが1クリックでそれらのページに到達できるようになり、また検索結果に表示されるようGoogleのボットやスパイダーにクロールされるようになります。 ページがリンク構造に組み込まれていない場合、それは「孤立ページ」と呼ばれます 。
しかし、 孤立ページとは具体的に何でしょうか? 本記事では、この用語を詳細に取り上げ、SEO観点での影響、発生する理由、こうしたページの見つけ方、そしてそれが引き起こす問題の解決方法を解説していきます。さあ、始めましょう!
孤立ページとは何か?
具体的には、 孤立ページとは、Googleや他の検索エンジンによってインデックスされる可能性があるかどうかにかかわらず、プラットフォームのページ構造に接続・リンクされず、完全に孤立した状態となったウェブサイト上のページのことです 。
このようにそのページは、訪問する可能性のあるユーザーや、検索結果に表示するためのGoogleボットからアクセスできない状態で 「漂っている」ように サイト上に存在します。たとえインデックスされていてもです。XMLサイトマップに該当URLが登録されていても、孤立ページが存在しないという保証はありません。何らかの理由や人為的ミスで、ユーザーや検索エンジンクローラーから到達できない状態になることがあるからです。

たとえば、ウェブサイトのページが発見される方法は2つあります。
-
リンクをたどってすべてのページを見つけるクローラーを通じて。
-
XMLサイトマップ内のURL一覧を通じて。
孤立した孤立ページが存在する場合、 sitemap に含まれていても、それを指すリンクがないため見つからず、まるで不可視であるかのように扱われます。
これは次のような一連の問題を引き起こします:
-
トラフィック
-
ポテンシャルの損失
-
SEOの問題
-
可視性
-
オーソリティ、そして
-
ペナルティの可能性
…他にもありますが、これらは後ほど詳しく説明します。今のところ明確なのは、サイトの大小にかかわらず、潜在的な孤立ページは修正しなければならず、それは可能であり、一般的なメンテナンスの慣行であるということです。
ウェブサイトに孤立ページが発生するのはなぜか?
オーナーや開発者が気付かないままに、ウェブサイトに孤立ページが発生する理由はいくつかあります。多くの場合、ウェブプラットフォームに望ましくないこの種のページは、不適切な方法で行われた変更によるもので、通常は人為的ミスが原因です。
以下に、ウェブサイトで孤立ページが生成・発生する 主要なシナリオ を示します。
-
ときどき、 ウェブサイトのページの内部リンクが変更される ことで、不要になった、古くなった、またはサイト最適化の理由から一部のURLが削除されます。多くの場合、リンクが削除されてもページがサイト上に漂ったまま、完全には削除されずに残ります。
-
A/Bテストページ で、エンドユーザーには触れさせないものが、サイト開発で使用された後、削除されずに残るケース。
-
ランディングページが一時的に生成された 場合、たとえば促販期間、クリスマスなど、ユーザーをサイトの顧客にするために作成され、その期間が過ぎてページが削除されたものの、インデックスされたURLが残るケース。
-
カテゴリーがサイトメニューから削除された ものの、その代わりに作成された別のカテゴリーへ 適切にリダイレクト されず、残されたページがプラットフォーム上にリンクのない状態で残るケース。
-
サイト移行時 には、フォーマット、URL、パラメータが変わる多数の孤立ページがしばしば生成されますが、削除されずに、サイトから切り離され孤立した状態になります。
-
ウェブサイト構築にテンプレートが使用される 場合、そのデフォルトのテンプレートページが残り、後で忘れ去られて削除されないケース。
一方、 すぐに対応・対処すべき孤立ページの一般的な原因が2つあります 。これらは本質的に 重複ページ で、本来一貫して単一URLへ自動リダイレクトされるべきものです。具体的には、canonical/non-canonicalページにおけるHTTPSとHTTPの一貫した使用、そして末尾スラッシュの使用に関するものです。
そうしないと、ページの一部のバージョンがリンクされず、結果として孤立する可能性があります。この場合、孤立していること自体が主な問題ではなく、重複している事実が問題となり、Googleにおいてコピーや低品質コンテンツと見なされ、ペナルティやインデックスの損失問題などを引き起こします。これについては、孤立ページの解決のセクションで後述します。
孤立ページはSEOに有益か有害か?
孤立ページは SEO観点での問題 であり、可視性、オーソリティ、コンテンツ損失、トラフィックの観点からも、プラットフォームに存在する数量によります。すなわち、プラットフォームに孤立ページが1つ、2つ、または少数あっても問題は起きないかもしれませんが、サイトの大部分を占めるようになると、問題が発生します。
サイトに孤立ページがないように最適化することは、SEOやその他の側面にとって重要であり、サイトに有益と言うことは決してできません。むしろ、多すぎると害になります。
第一に、検索エンジンはリンクを通じて孤立ページを見つけられないため、孤立ページはしばしばインデックスされず、検索結果に表示されることがなくなり、トラフィック、可視性、ポテンシャルに影響します。これについては後ほど独自のセクションでより詳しく説明します。
孤立ページが引き起こす一般的な問題
以下は、孤立ページが、特にサイトのリンク構造とURLのうち相当な部分を占める場合に引き起こす一般的な問題です。
-
ユーザー体験: あり得ないように思えるかもしれませんが、孤立ページはサイトのユーザー体験に大きく影響します。ユーザーがメニューや興味深いリンクから自然にページを訪問できないからです。ページが存在し、質の高いコンテンツを持っていてもです。
-
オーソリティ: 重要なページが孤立化し、サイトの他URLとのリンクを失うと、それらが持つはずのオーソリティはすべて無駄になり、Googleの検索結果におけるランキングに直接影響します。これは特定のキーワードに対する結果順序を決定する重要なSEO要素です。
-
コンテキスト :サイトの内部リンクは、Googleのクローラーにページのインデックス方法と、どの検索クエリにおいて重要かつ関連性が高いかのコンテキストを提供します。孤立ページはサイトおよびページ自体のコンテキストと意味的意義を失わせ、たとえインデックスされていてもです。
しかし、孤立ページが大量に存在する場合、ランキング、トラフィック、クロールへの影響ははるかに顕著になるため、これらは別途、より詳細に対処すべき問題です。
可視性とトラフィックが低いページの問題
孤立ページは、サイトおよび影響を受けた特定ページのランキングや順位、そしてそのトラフィックに直接、顕著なネガティブ影響を及ぼします。なぜなら、前述のように 孤立ページは孤立し不可視 となるからで、ボタンやクリックでサイト内を自然に見つけられないユーザーにも、Googleや他の検索エンジンのクローラーにも見つけられません。
これは明らかに、 多くのユーザーを得られないこと、そして孤立ページが検索結果に占める乏しい、または存在しない位置によって、サイトとページのトラフィックおよび可視性に影響します 。結果として、サイトとページにとって、特に商品、サービスその他のテーマに関する質の高いコンテンツを含む場合、ポテンシャルの完全な損失となります。トラフィックと可視性への影響は、ニッチや業界に対するサイトのオーソリティと関連性の損失にもつながり、競合との差を広げます。
クロール損失の問題
Googleは検索エンジンとして、 クロールバジェット(Crawl Budget)として知られるもの に従ってサイトのページをインデックスします。これは、検索エンジンのクローラーやスパイダーがインデックスするページを見つけるために費やす時間と説明できます。サイトのページ数が多いほど時間がかかり、つまりクロールバジェットも多く必要になります。
ここで ウェブサイトの構造、アーキテクチャ、その他要素の最適化 が関係し、孤立ページもその一つです。サイトに無関係な孤立ページがあると、それが等しくクロールバジェットを消費し、これは無駄になり、健全で良いコンテンツのページがインデックスされないことを招き得て、検索結果やトラフィックに影響します。要するに、孤立ページはGoogleが費やしたくないリソースの浪費を意味します。
孤立ページとDead Endページの違い
SEOにおいては、孤立ページ(orphan page)という用語が、 dead endページ「Dead End」 と混同されがちです。両者は類似した問題を表しますが、同じものではありません。孤立ページについては既に定義したので、dead endに進みましょう。
dead endページとは、サイトの内部リンクからも、他の外部ウェブプラットフォームからもリンクされていないページ 。すなわち、そこに到達した後は、閉じて立ち去ることしかできないページです。
Googleなどの検索エンジンのクローラーがdead endページに落ちた場合、行く場所がなく、ここからその名前が来ています。行き止まりの道路に例えています。
サイトの孤立ページを見つける方法
孤立ページや Orphan Pages に関連する問題を解決し始めるために、まずやるべきことはそれらを見つけることです。明らかに、サイトのユーザーとしても開発者としても、一見しただけでは表示されないからです。幸いなことに、ウェブサイト構造全体を詳細に分析するさまざまなツール、SEOソフトウェアが使用でき、サーバーログを通じてすべての完全な像を得られます。
孤立ページの特定だけでなくSEO戦略の促進・改善にも役立つ強力な SEOソフトウェア が必要なら、SEO Aliveが社内開発したプログラムをチェックしてみてください!
Screaming Frogで孤立ページを認識する
前述のとおり、こうした孤立ページの特定に役立つプログラムは市場にいくつかあります。最もよく知られている Screaming Frog で どう行うか をシンプルに説明します。
Screaming Frog には2つの異なるプログラムがあります。最も知られているものは、見つけた内部リンクをたどってウェブサイト全体をクロールするもので、もう1つは log analyser で、 サーバーアクセスログ を分析します。Googlebot(または別のユーザーエージェント)が当社のページを訪問した際に残る記録のことです。
最初のものでは、クローラーがナビゲートしている間に見つけたURLを総合的にリスト化したファイルを抽出します。レポートセクションの「 all inlinks 」配下にあるExcelファイルとして見つけられます。

このファイルが手元にあれば、 サーバーからログを取得 します。通常は前述の記録の圧縮ファイルです。それをScreaming Frogの log analyser に読み込ませると、読み込んだ期間中にGooglebotが訪問したすべてのURLが、リンクの有無にかかわらず表示されるパネルが得られます。
最後のステップは、前のステップで作成したExcelファイルを log analyser の所定セクションに読み込ませることです。すると、新しいタブが有効になり、次のオプションが表示されます。

-
Matched with URL data :内部リンクがあり、Googleが訪問したURLの集合。
-
Not in log file :リンクされているものの何らかの理由でGoogleからのイベント(訪問)を受けていないURL。
-
Not in URL data :今回関心のあるグループ。Googleが訪問してログに記録を残しているものの、シミュレーション時にクローラーが見つけられなかったURL。すなわち内部リンクされておらず、私たちが探していたOrphan Pagesです。
この第3グループから、孤立として分類するページのリストを抽出し、200ステータスコードを返すものが基本的に最適化の対象になります。
孤立ページ問題を解決するには?
一般的に手作業では、内部リンクに統合されていないURLがある場合に できることは4つあり 、いくつかの判断が必要です。
-
まず、移行後に 孤立ページ がある可能性が高く、それらをレビューして、その多くが 関連性の低い、薄い、重複したコンテンツであれば、削除し 、必要に応じて、サイトのオーソリティの高い類似または注目ページへの301リダイレクトを設定するのが最善です。
-
次に、何らかの理由で コンテンツ、オーソリティ、トラフィックが良いため、孤立ページを残したい 場合、 次のステップは、関連コンテンツを持ち、ユーザーやGoogleが容易にアクセスできるサイトのURLからリンクすること です。もちろん、ページのURLはサイトマップに含めるべきです。
-
第3に、 多数の孤立ページが現れ、それらの性質が一時的 で、特定時期に紐付くプロモーションや内容を含むため期限切れになっている場合、前のステップと同じように関連性の高い、アクセス可能な内部ページにリンクします。ただしこの場合、 「noindex」メタタグを含めて そのURLがインデックスされず、クローラーに考慮されないようにします。
-
最後に、重複またはほぼ重複したコンテンツを持つ孤立ページの場合、そのページを削除し、内容を別のページに含めて失わずに、その全体的なポテンシャルを引き続き活用することを検討する価値があります。
結論
孤立ページは、さまざまな理由でウェブサイトに発生する自然な要素であり、過剰でなく、その数が指数関数的に増えなければ、何の問題もありません。
一方、ウェブサイトの大きな割合とその内部リンクがこの種類のページで占められると、SEOに関連するクロール、ランキング、トラフィック、そしてオーソリティ、ユーザー体験など、対処が必要な多くの問題を引き起こす可能性があります。
良いニュースは、孤立ページはさまざまな方法で解決可能ですが、常に分析プロセスにおいてです。問うべきは、各特定の孤立ページがランキング、コンテンツの観点で関連性があり、別のページにリンクできるかであり、そうでない場合は単に削除することです。
さて、読者の皆さん…孤立ページの存在をご存じでしたか?ご自身のプロジェクトやクライアントのプロジェクトでこの要素に出くわしたことはありますか?コメントを残していただければご返信します。本当にありがとうございます。それではまた!
著者: David Kaufmann

私はこの10年以上、SEOに完全に夢中になって過ごしてきました。正直なところ、他の生き方は考えられません。
私のキャリアが新たな次元に到達したのは、Chess.com でシニアSEOスペシャリストとして働いたときでした。Chess.com はインターネット全体で最も訪問数の多い上位100サイトの1つです。数百万ページ、数十言語、そして最も競争の激しい SERPs の1つという規模で仕事をした経験は、どんなコースや資格でも得られないことを教えてくれました。あの経験は、本当に優れたSEOとは何かという私の視点を一変させ、それ以降に私が築いてきたすべての土台となりました。
その経験から、私は SEO Alive を創業しました。オーガニック成長に本気で取り組むブランドのためのエージェンシーです。私たちは dashboards や月次レポートを売るためにここにいるのではありません。本当に成果を動かす戦略を構築するためにここにいます。クラシカルなSEOの最良の部分と、Generative Engine Optimization (GEO) というエキサイティングな新しい世界を組み合わせ、あなたのブランドが Google の青いリンクだけでなく、ChatGPT、Perplexity、Google AI Overviews が毎日何百万人もの人々に届けている AI 生成の回答の中にも確実に表示されるようにします。
そして、この両方の世界をきちんと扱えるツールが見つからなかったので、自分で作りました。それが SEOcrawl です。rankings、テクニカル監査、backlinks モニタリング、crawl ヘルス、そして AI ブランド可視性トラッキングを1つの場所に統合した、エンタープライズ向けのSEOインテリジェンスプラットフォームです。まさに、ずっと存在してほしいと願っていたプラットフォームです。
この著者の他のコンテンツをご覧ください

