AI用語集:AI検索とGEOの基本用語をわかりやすく解説

MCP、RAG、グラウンディング、AIシェア・オブ・ボイス……AI検索の世界の言葉は驚くほど速く進化し、1年前には存在しなかった用語が今日ではあらゆる場所で使われていることもあります。本用語集では、マーケターとSEO担当者が押さえておくべき AI・GEO用語 を解説します。
私たちのSEO用語集が従来型検索のための辞書だとすれば、こちらはその姉妹版、生成AI時代のための辞書だとお考えください。ChatGPT、Gemini、Perplexity、GoogleのAI Overviewが実際にどのようにコンテンツを発見し、読み込み、引用するのかを理解するために必要な言葉をまとめています。各項目は短く実用的にまとめており、詳しいガイドを用意しているものについては、より深く学べるよう直接リンクを張っています。
リンクのランキングから回答の生成へと検索が移り変わったことで、機械学習から借用した語彙を中心に、まったく新しい言葉が次々と生まれました。この分野で働くのにデータサイエンスの学位は必要ありませんが、人々が埋め込み(embedding)、グラウンディング、クエリ・ファンアウトといった言葉について話すとき、それが何を意味するのかは知っておく必要があります。このページをブックマークして、AI検索の言葉を流暢に話せるようになりましょう。
本用語集は、David KaufmannとSEOcrawlチームが運営しています。AIエンジンが日々どのようにブランドを引用しているかを追跡している人たちです。
A
AEO (Answer Engine Optimization)
Answer Engine Optimization(アンサーエンジン最適化)とは、AIのアンサーエンジンが直接的な回答の情報源としてコンテンツを選ぶよう最適化する取り組みです。GEOと密接に関連していますが、10本の青いリンクのうちの1つになるのではなく、その回答そのものになることに重点を置いています。
Agent (AI agent)
AIエージェントとは、言語モデルを使って単にテキストを返すのではなく、行動を起こすシステムのことです。ツールを呼び出したり、ブラウジングをしたり、複数ステップのタスクを完了させたりします。MCPのようなプロトコルが重要なのは、まさにこのためです。エージェントは、外部のデータやサービスに到達するための安全で標準的な手段を必要とするからです。
AI Mode
AI Mode は、チャット形式のインターフェースが追加の質問に直接答える、Googleの会話型AI生成検索体験です。AI Mode内での登場は従来のランキングのようには測定できませんが、そこから送られるクリックはアナリティクスで追跡できます。
AI Overview
AI Overview は、Googleが多くの検索結果の上部に配置する、AIが生成する要約です。複数の情報源から内容を引き出し、それらを引用します。この引用される情報源に名を連ねることは、GEOの中心的な目標です。
Answer engine
アンサーエンジンとは、クエリに対してリンクの一覧ではなく統合された回答で応答するあらゆるシステムのことです。ChatGPT、Perplexity、Gemini、GoogleのAI Overviewはすべてこれに該当します。この用語は、AEOの背後にある戦略的な転換を端的に表しています。
B
Brand mention monitoring
AI検索におけるブランド言及モニタリングとは、AIエンジンがその回答の中で自社ブランドをいつ・どこで・どのように名指しするかを追跡することです。見えないものは改善できないため、これはあらゆるAI可視性戦略の土台となります。
C
Chunking
チャンキングとは、検索(リトリーバル)システムが最も関連性の高い箇所を索引付けして取得できるよう、コンテンツを小さな一節に分割する処理のことです。短いセクション、内容を表す見出し、それ自体で完結する段落といった明確な構造により、コンテンツはチャンク化・取得しやすくなります。
Citation
AI引用とは、AIが生成する回答の中であなたのサイトやブランドへ言及することで、リンク付きの情報源、脚注、または文中の言及として表示されます。引用は、従来型SEOにおけるランキングと同じく、AI検索における可視性の単位であり、各ブランドが獲得を競い合う対象です。
Crawler (AI crawler)
AIクローラーとは、AI企業が学習やリアルタイムの取得のためにウェブコンテンツを収集する目的で運用するボットのことです。例えばGPTBot、ClaudeBot、Google-Extended、PerplexityBotなどがあります。あなたのrobots.txtが、これらのうちどれにサイトへのアクセスを許可するかを制御します。
E
Embedding
**埋め込み(エンベディング)**とは、テキスト(または画像)の意味を数値のリストとして表したものです。これによってモデルは、2つのコンテンツがどれだけ似ているかを測定できます。埋め込みは、AIシステム内のセマンティック検索とリトリーバル(情報の取得)を支えています。
Entity
エンティティとは、人物、ブランド、製品、場所といった、明確に識別できる個別の存在のことで、エンジンはこれらをナレッジグラフ内で追跡し結びつけます。明確なエンティティとして認識されることは、AIエンジンがあなたのブランドを正しいトピックと関連付け、自信を持って言及する助けになります。
F
Fine-tuning
ファインチューニングとは、ベースモデルを特定のデータセットでさらに学習させ、その振る舞いや知識を特化させる処理のことです。リトリーバル(情報の取得)とは別物で、ファインチューニングは情報をモデルそのものに組み込むのに対し、リトリーバルは回答時に情報を取得します。
G
GEO (Generative Engine Optimization)
Generative Engine Optimization(生成エンジン最適化)とは、生成AIエンジンがあなたを言及・引用するよう、コンテンツとブランドの存在感を最適化する分野です。SEOをChatGPT、Gemini、Perplexity、AI Overviewへと拡張するものです。
Grounding
グラウンディングとは、AIエンジンが学習したパラメータだけに頼るのではなく、取得した検証可能な情報源に基づいて回答を組み立てることを指します。グラウンディングされた回答は引用を含む可能性が最も高く、だからこそ、AIが取得しやすく信頼できる情報源であることが重要なのです。
H
Hallucination
**ハルシネーション(幻覚)**とは、AIモデルがもっともらしく生成してしまう、誤った、あるいは事実無根の記述のことです。しっかりと構造化された引用可能なコンテンツがあれば、エンジンが正しい事実を取得せずにあなたのブランドについて誤った情報を作り出す可能性を減らせます。
K
Knowledge graph
ナレッジグラフとは、エンティティとそれらの間の関係を構造化して描き出した地図のことです。AIエンジンはナレッジグラフを頼りに、ブランドの曖昧さを解消し、あなたについてどの事実を信頼すべきかを判断します。
L
LLM (Large Language Model)
大規模言語モデルとは、膨大な量のテキストで学習し、言語を予測・生成するAIモデルのことで、ChatGPT、Claude、Geminiなどを支えるエンジンです。AI検索におけるすべては、最終的には何らかのLLMの上で動いています。
llms.txt
llms.txt は、あなたの最も重要なコンテンツを、整理された構造化された形でAIモデルに示すために提案されているプレーンテキストファイルです。普及はまだ始まったばかりであり、しっかりとクロール可能なコンテンツの代わりにはなりません。
M
MCP (Model Context Protocol)
Model Context Protocol は、AIアシスタントが外部のツールやデータソースに一貫した方法で接続できるようにするオープンスタンダードです。モデルが、学習内容から推測する代わりに、SEOcrawlのようなサービスを安全に呼び出してリアルタイムのSEOデータを取得する仕組みになります。
Multimodal
マルチモーダルとは、同じシステムの中でテキスト、画像、音声、動画など複数の種類の入力を処理できるモデルを指します。AIエンジンが今や言葉だけでなく、スクリーンショットやグラフまで読み取れるのは、このためです。
P
Prompt
プロンプトとは、AIモデルに回答を生成させるために与える指示や質問のことです。AI検索においては、実際のユーザーが入力するプロンプトこそが、あなたが表示されたいと狙っているクエリにほかなりません。
Prompt tracking
プロンプトトラッキングとは、定められた一連のプロンプトに対してAIエンジンが時系列でどう答えるか、つまりどのブランドを言及し、どの情報源を引用し、それがどう変化するかを監視することです。AI検索における、ランクトラッキングに相当するものです。
Q
Query fan-out
クエリ・ファンアウトとは、AIエンジンが1つのユーザーの質問を複数のサブクエリに分解し、それらを並行して実行し、結果を1つの回答に統合する手法のことです。これを理解すると、1つの正確なフレーズを狙うよりも、トピックを徹底的に網羅するほうが有利である理由がわかります。
R
RAG (Retrieval-Augmented Generation)
RAG とは、モデルが回答時に関連する文書を取得し、それを使ってグラウンディングされた、情報源付きの回答を生成するアーキテクチャです。ほとんどのAI検索体験は何らかの形のRAGであり、だからこそAIに取得されやすいことがすべてを左右するのです。
Reranking
リランキングとは、モデルが回答を書く前に、取得した一節を関連性によって並べ替える二段階目の処理のことです。単に人気があるだけの一節ではなく、最も有用でよく合致した一節がしばしば選ばれるのは、これが一因です。
S
Share of AI voice
AIシェア・オブ・ボイスとは、あるトピックやプロンプト群について、AIの回答のうち競合に対して自社ブランドが登場する割合のことです。AI可視性を測定し、競合とベンチマークするための代表的な指標です。
T
Token
トークンとは、モデルが読み込み・生成するテキストの単位で、おおよそ1単語または単語の一部に相当します。トークンが重要なのは、モデルが扱えるコンテキストの上限と、それを動かすコストを左右するからです。
Training data
学習データとは、モデルが公開される前に学習した、テキストやその他のコンテンツの集合体のことです。あなたのブランドや事実がウェブ全体で十分に取り上げられていれば、モデルがすでに「知っている」内容に反映される可能性が高くなります。
V
Vector database
ベクトルデータベースは、埋め込みを保存し、完全一致のキーワードではなく意味の近さによってクエリに最も近いものを見つけます。セマンティック検索や多くのRAGシステムを支える検索エンジンです。
Z
Zero-click
ゼロクリックの結果とは、ユーザーがインターフェース上で直接答えを得て、ウェブサイトを一度も訪れないものを指します。AIの回答はゼロクリックをさらに押し上げており、だからこそ回答の中での可視性、つまり引用と言及が、今やクリックと同じくらい重要になっているのです。
著者: David Kaufmann

私はこの10年以上、SEOに完全に夢中になって過ごしてきました。正直なところ、他の生き方は考えられません。
私のキャリアが新たな次元に到達したのは、Chess.com でシニアSEOスペシャリストとして働いたときでした。Chess.com はインターネット全体で最も訪問数の多い上位100サイトの1つです。数百万ページ、数十言語、そして最も競争の激しい SERPs の1つという規模で仕事をした経験は、どんなコースや資格でも得られないことを教えてくれました。あの経験は、本当に優れたSEOとは何かという私の視点を一変させ、それ以降に私が築いてきたすべての土台となりました。
その経験から、私は SEO Alive を創業しました。オーガニック成長に本気で取り組むブランドのためのエージェンシーです。私たちは dashboards や月次レポートを売るためにここにいるのではありません。本当に成果を動かす戦略を構築するためにここにいます。クラシカルなSEOの最良の部分と、Generative Engine Optimization (GEO) というエキサイティングな新しい世界を組み合わせ、あなたのブランドが Google の青いリンクだけでなく、ChatGPT、Perplexity、Google AI Overviews が毎日何百万人もの人々に届けている AI 生成の回答の中にも確実に表示されるようにします。
そして、この両方の世界をきちんと扱えるツールが見つからなかったので、自分で作りました。それが SEOcrawl です。rankings、テクニカル監査、backlinks モニタリング、crawl ヘルス、そして AI ブランド可視性トラッキングを1つの場所に統合した、エンタープライズ向けのSEOインテリジェンスプラットフォームです。まさに、ずっと存在してほしいと願っていたプラットフォームです。
この著者の他のコンテンツをご覧ください

