Dictionnaire de l'IA : glossaire des termes du search IA et du GEO

Dictionnaire de l'IA : glossaire des termes du search IA et du GEO
David Kaufmann
Tutoriels AI & GEO

MCP, RAG, ancrage, part de voix dans l'IA… le vocabulaire du search IA évolue vite, et un terme qui n'existait pas il y a un an peut être partout aujourd'hui. Ce glossaire définit les termes de l'IA et du GEO que tout marketeur et SEO doit connaître.

Si notre glossaire SEO est le dictionnaire du search classique, considérez celui-ci comme son compagnon pour l'ère générative — les mots dont vous avez besoin pour comprendre comment ChatGPT, Gemini, Perplexity et les AI Overviews de Google trouvent, lisent et citent réellement le contenu. Chaque entrée est courte et pratique, et lorsque nous avons rédigé un guide complet, nous y renvoyons directement pour que vous puissiez approfondir.

Le passage du classement de liens à la génération de réponses a apporté tout un nouveau vocabulaire, en grande partie emprunté au machine learning. Pas besoin d'un diplôme en data science pour travailler dans ce domaine, mais il faut savoir ce que les gens veulent dire lorsqu'ils parlent d'embeddings, d'ancrage ou de query fan-out. Mettez cette page en favori et commencez à parler couramment le search IA.

Ce glossaire est tenu à jour par David Kaufmann et l'équipe SEOcrawl — celles et ceux qui suivent au quotidien la façon dont les moteurs d'IA citent les marques.

A

AEO (Answer Engine Optimization)

L'Answer Engine Optimization est la pratique consistant à optimiser le contenu pour que les moteurs de réponses IA le sélectionnent comme source d'une réponse directe. Elle est étroitement liée au GEO, avec l'accent mis sur le fait d'être la réponse plutôt que l'un des dix liens bleus.

SEO vs AEO vs GEO comparés : le SEO se positionne dans les résultats de recherche et mesure les positions, les clics et le CTR ; l'AEO est cité dans les fonctionnalités IA et mesure le taux d'inclusion dans les AI Overviews et la propriété des snippets ; le GEO est nommé par les LLM et mesure le taux de mention, le taux de citation et la part de voix
SEO vs AEO vs GEO en un coup d'œil

AI Mode

AI Mode est l'expérience de recherche conversationnelle et générée par IA de Google, où une interface de type chat répond directement aux questions de suivi. Les apparitions dans AI Mode ne peuvent pas être mesurées comme le sont les classements classiques, même si les clics qu'il génère peuvent être suivis dans les outils d'analyse.

AI Overview

Un AI Overview est le résumé généré par IA que Google place en haut de nombreux résultats de recherche, en s'appuyant sur plusieurs sources et en les citant. Obtenir une place parmi ces sources citées est un objectif central du GEO.

Agent (agent IA)

Un agent IA est un système qui utilise un modèle de langage pour passer à l'action — appeler des outils, naviguer ou accomplir des tâches en plusieurs étapes — plutôt que de simplement renvoyer du texte. Les agents sont la raison pour laquelle des protocoles comme le MCP comptent : ils ont besoin d'un moyen sûr et standard d'accéder à des données et des services externes.

Ancrage (grounding)

L'ancrage (grounding) désigne le fait pour un moteur d'IA de fonder sa réponse sur des sources récupérées et vérifiables, plutôt que sur ses seuls paramètres entraînés. Les réponses ancrées sont celles qui ont le plus de chances d'inclure des citations — c'est précisément pourquoi il est important d'être une source récupérable et digne de confiance.

B

Base de données vectorielle

Une base de données vectorielle stocke des embeddings et trouve les correspondances les plus proches d'une requête par le sens plutôt que par mots-clés exacts. C'est le moteur de récupération derrière la recherche sémantique et la plupart des systèmes RAG.

C

Chunking

Le chunking est le processus consistant à découper le contenu en passages plus petits afin qu'un système de récupération puisse indexer et extraire le fragment le plus pertinent. Une structure claire — sections courtes, titres descriptifs, paragraphes autonomes — rend le contenu plus facile à découper et à récupérer.

Citation

Une citation IA est une référence à votre site ou à votre marque à l'intérieur d'une réponse générée par IA, affichée comme une source liée, une note de bas de page ou une mention en ligne. Les citations sont au search IA ce que les classements sont au SEO classique : l'unité de visibilité que vous cherchez à conquérir.

D

Flux en quatre étapes : l'utilisateur pose une question avec la recherche web, ChatGPT interroge Bing, lit et choisit des passages, et la réponse cite votre page
Comment ChatGPT récupère et cite ses sources

Données d'entraînement

Les données d'entraînement constituent l'ensemble des textes et autres contenus à partir desquels un modèle a appris avant son déploiement. Si votre marque et vos informations sont bien représentées sur le web, elles ont plus de chances de se refléter dans ce qu'un modèle « sait » déjà.

E

Embedding

Un embedding est une représentation numérique d'un texte (ou d'images) qui capture le sens sous forme d'une liste de nombres, afin qu'un modèle puisse mesurer à quel point deux contenus se ressemblent. Les embeddings alimentent la recherche sémantique et la récupération au sein des systèmes d'IA.

Entité

Une entité est une chose distincte et identifiable — une personne, une marque, un produit ou un lieu — que les moteurs suivent et relient dans un graphe de connaissances. Être reconnu comme une entité claire aide les moteurs d'IA à associer votre marque aux bons sujets et à la mentionner avec assurance.

F

Fine-tuning

Le fine-tuning est le processus consistant à poursuivre l'entraînement d'un modèle de base sur un jeu de données ciblé afin de spécialiser son comportement ou ses connaissances. Il se distingue de la récupération : le fine-tuning inscrit l'information dans le modèle, tandis que la récupération va la chercher au moment de la réponse.

G

GEO (Generative Engine Optimization)

La Generative Engine Optimization est la discipline consistant à optimiser votre contenu et la présence de votre marque pour que les moteurs d'IA générative vous mentionnent et vous citent. Elle prolonge le SEO dans ChatGPT, Gemini, Perplexity et les AI Overviews.

Graphe de connaissances

Un graphe de connaissances est une carte structurée des entités et des relations qui les relient. Les moteurs d'IA s'appuient sur les graphes de connaissances pour lever l'ambiguïté entre les marques et décider quels faits ils peuvent considérer comme fiables à votre sujet.

H

Hallucination

Une hallucination est une affirmation assurée mais fausse ou inventée produite par un modèle d'IA. Un contenu solide, bien structuré et citable réduit le risque qu'un moteur invente des détails sur votre marque au lieu d'en extraire les faits exacts.

L

LLM (Large Language Model)

Un grand modèle de langage (LLM) est un modèle d'IA entraîné sur d'énormes quantités de texte pour prédire et générer du langage — le moteur derrière ChatGPT, Claude, Gemini et d'autres. Tout, dans le search IA, repose en fin de compte sur l'un d'eux.

llms.txt

llms.txt est un fichier en texte brut proposé qui oriente les modèles d'IA vers vos contenus les plus importants sous une forme claire et structurée. Son adoption en est encore à ses débuts, et il ne remplace pas un contenu solide et crawlable.

M

MCP (Model Context Protocol)

Le Model Context Protocol est un standard ouvert qui permet aux assistants IA de se connecter de manière cohérente à des outils et des sources de données externes. C'est ainsi qu'un modèle peut appeler en toute sécurité un service comme SEOcrawl pour récupérer des données SEO en direct, au lieu de deviner à partir de son entraînement.

Moteur de réponses

Un moteur de réponses est tout système qui répond à une requête par une réponse synthétisée plutôt que par une liste de liens — ChatGPT, Perplexity, Gemini et les AI Overviews de Google en sont autant d'exemples. Le terme résume le virage stratégique derrière l'AEO.

Les cinq plateformes IA que cible le GEO et la façon dont chacune cite ses sources : Google AI Overviews, Perplexity, ChatGPT, Google Gemini et Microsoft Copilot
Les plateformes que cible le GEO

Multimodal

Multimodal décrit un modèle capable de traiter plusieurs types d'entrées — texte, images, audio ou vidéo — au sein du même système. C'est pourquoi les moteurs d'IA peuvent désormais lire une capture d'écran ou un graphique, et pas seulement des mots.

P

Part de voix dans l'IA

La part de voix dans l'IA (share of AI voice) est le pourcentage de réponses IA, pour un sujet ou un ensemble de prompts, dans lesquelles votre marque apparaît face à celles des concurrents. C'est la métrique phare pour mesurer la visibilité dans l'IA et vous situer par rapport à la concurrence.

Prompt

Un prompt est l'instruction ou la question que vous donnez à un modèle d'IA pour qu'il produise une réponse. Dans le search IA, les prompts que les utilisateurs réels saisissent sont les requêtes pour lesquelles vous cherchez à apparaître.

Prompt tracking

Le prompt tracking consiste à surveiller dans le temps la façon dont les moteurs d'IA répondent à un ensemble défini de prompts — quelles marques ils mentionnent, quelles sources ils citent, et comment cela évolue. C'est l'équivalent, dans le search IA, du suivi de positions.

Q

Query fan-out

Le query fan-out est la technique par laquelle un moteur d'IA décompose une question unique de l'utilisateur en plusieurs sous-requêtes, les exécute en parallèle et synthétise les résultats en une seule réponse. Le comprendre permet de saisir pourquoi couvrir un sujet en profondeur l'emporte sur le ciblage d'une seule expression exacte.

R

RAG (Retrieval-Augmented Generation)

Le RAG est une architecture dans laquelle un modèle récupère des documents pertinents au moment de la réponse et les utilise pour générer une réponse ancrée et sourcée. La plupart des expériences de search IA sont une forme de RAG — c'est pourquoi être récupérable, c'est tout l'enjeu.

Schéma du fonctionnement de la génération augmentée par récupération : la question d'un utilisateur est mise en correspondance avec des pages indexées, le modèle synthétise une réponse, et la réponse cite votre page
Comment les moteurs IA récupèrent et citent les sources

Reranking

Le reranking est une étape de second passage qui réordonne les passages récupérés selon leur pertinence avant que le modèle ne rédige sa réponse. C'est l'une des raisons pour lesquelles le passage le plus utile et le mieux adapté l'emporte souvent sur celui qui est seulement populaire.

Robot d'IA (AI crawler)

Un robot d'IA (AI crawler) est un bot exploité par une entreprise d'IA pour collecter du contenu web à des fins d'entraînement ou de récupération en direct — par exemple GPTBot, ClaudeBot, Google-Extended ou PerplexityBot. Votre fichier robots.txt contrôle lesquels d'entre eux peuvent accéder à votre site.

S

Suivi des mentions de marque

Le suivi des mentions de marque dans le search IA consiste à repérer quand, où et comment les moteurs d'IA nomment votre marque dans leurs réponses. C'est le fondement de toute stratégie de visibilité dans l'IA, car on ne peut pas améliorer ce que l'on ne voit pas.

T

Token

Un token est l'unité de texte qu'un modèle lit et génère — à peu près un mot ou un fragment de mot. Les tokens comptent parce qu'ils définissent les limites de contexte d'un modèle et le coût de son exécution.

Z

Zero-click

Un résultat zero-click est un résultat où l'utilisateur obtient sa réponse directement dans l'interface et ne visite jamais de site web. Les réponses IA ont fait grimper le zero-click, et c'est pourquoi la visibilité à l'intérieur de la réponse — citations et mentions — compte désormais autant que le clic.

Auteur : David Kaufmann

David Kaufmann

Cela fait plus de 10 ans que je suis totalement obsédé par le SEO — et honnêtement, je ne voudrais pas qu'il en soit autrement.

Ma carrière a franchi un cap lorsque j'ai travaillé comme Senior SEO Specialist pour Chess.com — l'un des 100 sites les plus visités de tout Internet. Opérer à cette échelle, sur des millions de pages, des dizaines de langues et dans l'une des SERPs les plus concurrentielles qui soient, m'a appris des choses qu'aucun cours ni aucune certification ne pourrait jamais transmettre. Cette expérience a transformé ma vision de ce qu'est réellement un SEO d'excellence — et elle est devenue le socle de tout ce que j'ai construit depuis.

Forcé par cette expérience, j'ai fondé SEO Alive — une agence pour les marques qui prennent la croissance organique au sérieux. Nous ne sommes pas là pour vendre des dashboards et des rapports mensuels. Nous sommes là pour bâtir des stratégies qui font vraiment la différence, en combinant le meilleur du SEO classique avec le nouvel univers passionnant de la Generative Engine Optimization (GEO) — afin que votre marque apparaisse non seulement dans les liens bleus de Google, mais aussi dans les réponses générées par l'AI que ChatGPT, Perplexity et Google AI Overviews livrent chaque jour à des millions de personnes.

Et parce que je ne trouvais aucun outil capable de gérer correctement ces deux mondes, j'en ai construit un moi-même — SEOcrawl, une plateforme d'intelligence SEO pour les entreprises qui réunit rankings, audits techniques, monitoring des backlinks, santé du crawl et suivi de la visibilité de marque dans l'AI, le tout au même endroit. C'est la plateforme dont j'ai toujours rêvé.

→ Lire tous les articles de David
Plus d'articles de David Kaufmann

Découvrez plus de contenu de cet auteur