Diccionario de IA: glosario de términos de búsqueda con IA y GEO

MCP, RAG, grounding, cuota de voz en IA… el lenguaje de la búsqueda con IA avanza rápido, y un término que no existía hace un año puede estar hoy en todas partes. Este glosario define los términos de IA y GEO que todo marketer y SEO necesita conocer.
Si nuestro diccionario SEO es el diccionario de la búsqueda clásica, piensa en este como su compañero para la era generativa: las palabras que necesitas para entender cómo ChatGPT, Gemini, Perplexity y las AI Overviews de Google encuentran, leen y citan contenido de verdad. Cada entrada es corta y práctica, y allí donde hemos escrito una guía completa enlazamos directamente a ella para que puedas profundizar.
El paso de posicionar enlaces a generar respuestas ha traído todo un vocabulario nuevo, buena parte de él heredado del machine learning. No hace falta una carrera en ciencia de datos para moverse en este terreno, pero sí saber a qué se refieren los demás cuando hablan de embeddings, grounding o query fan-out. Guarda esta página en favoritos y empieza a hablar el idioma de la búsqueda con IA con fluidez.
Este glosario lo mantienen David Kaufmann y el equipo de SEOcrawl, las personas que cada día monitorizan cómo los motores de IA citan a las marcas.
A
AEO (Answer Engine Optimization)
La Answer Engine Optimization es la práctica de optimizar el contenido para que los motores de respuesta con IA lo seleccionen como fuente de una respuesta directa. Está muy ligada al GEO, con el énfasis puesto en ser la respuesta en lugar de uno más de los diez enlaces azules.
Agente (IA)
Un agente de IA es un sistema que usa un modelo de lenguaje para realizar acciones —llamar a herramientas, navegar o completar tareas de varios pasos— en lugar de limitarse a devolver texto. Los agentes son la razón por la que protocolos como MCP importan: necesitan una forma segura y estándar de llegar a datos y servicios externos.
AI Mode
AI Mode es la experiencia de búsqueda conversacional y generada por IA de Google, donde una interfaz tipo chat responde directamente a las preguntas de seguimiento. Las apariciones dentro de AI Mode no pueden medirse como los rankings clásicos, aunque los clics que envía sí pueden seguirse en analítica.
AI Overview
Una AI Overview es el resumen generado por IA que Google coloca en la parte superior de muchos resultados de búsqueda, tomando información de varias fuentes y citándolas. Ganar un lugar entre esas fuentes citadas es un objetivo central del GEO.
Alucinación
Una alucinación es una afirmación segura pero falsa o inventada producida por un modelo de IA. Un contenido sólido, bien estructurado y citable reduce la probabilidad de que un motor invente detalles sobre tu marca en lugar de recuperar los datos correctos.
B
Base de datos vectorial
Una base de datos vectorial almacena embeddings y encuentra las coincidencias más próximas a una consulta por significado, en lugar de por palabras clave exactas. Es el motor de recuperación que hay detrás de la búsqueda semántica y de la mayoría de sistemas RAG.
C
Chunking
El chunking es el proceso de dividir el contenido en pasajes más pequeños para que un sistema de recuperación pueda indexar y obtener la pieza más relevante. Una estructura clara —secciones cortas, encabezados descriptivos, párrafos autocontenidos— hace que el contenido sea más fácil de fragmentar y recuperar.
Citación
Una citación de IA es una referencia a tu sitio o a tu marca dentro de una respuesta generada por IA, mostrada como una fuente enlazada, una nota al pie o una mención en línea. Las citaciones son a la búsqueda con IA lo que los rankings son al SEO clásico: la unidad de visibilidad por la que compites.
Cuota de voz en IA
La cuota de voz en IA es el porcentaje de respuestas de IA, para un tema o un conjunto de prompts, en las que aparece tu marca frente a la competencia. Es la métrica estrella para medir la visibilidad en IA y compararte con tus rivales.
D
Datos de entrenamiento
Los datos de entrenamiento son el conjunto de texto y otros contenidos a partir de los cuales un modelo aprendió antes de su despliegue. Si tu marca y tus datos están bien representados en la web, es más probable que se reflejen en lo que un modelo ya "sabe".
E
Embedding
Un embedding es una representación numérica de un texto (o de imágenes) que captura el significado como una lista de números, de modo que un modelo pueda medir cuán parecidos son dos contenidos. Los embeddings hacen posibles la búsqueda semántica y la recuperación dentro de los sistemas de IA.
Entidad
Una entidad es una cosa concreta e identificable —una persona, marca, producto o lugar— que los motores rastrean y conectan en un grafo de conocimiento. Que te reconozcan como una entidad clara ayuda a los motores de IA a asociar tu marca con los temas adecuados y a mencionarla con confianza.
F
Fine-tuning
El fine-tuning es el proceso de seguir entrenando un modelo base sobre un conjunto de datos acotado para especializar su comportamiento o su conocimiento. Es distinto de la recuperación: el fine-tuning incrusta la información en el modelo, mientras que la recuperación la obtiene en el momento de responder.
G
GEO (Generative Engine Optimization)
La Generative Engine Optimization es la disciplina de optimizar tu contenido y la presencia de tu marca para que los motores de IA generativa te mencionen y te citen. Extiende el SEO a ChatGPT, Gemini, Perplexity y las AI Overviews.
Grafo de conocimiento
Un grafo de conocimiento es un mapa estructurado de entidades y de las relaciones entre ellas. Los motores de IA se apoyan en los grafos de conocimiento para desambiguar marcas y decidir qué datos creer sobre ti.
Grounding
El grounding se produce cuando un motor de IA basa su respuesta en fuentes recuperadas y verificables, en lugar de basarse solo en sus parámetros entrenados. Las respuestas con grounding son las que tienen más probabilidades de incluir citaciones, y por eso ser una fuente recuperable y fiable importa tanto.
L
LLM (Large Language Model)
Un modelo de lenguaje de gran tamaño es un modelo de IA entrenado con enormes cantidades de texto para predecir y generar lenguaje: el motor que hay detrás de ChatGPT, Claude, Gemini y otros. Todo en la búsqueda con IA funciona, en última instancia, sobre uno de ellos.
llms.txt
llms.txt es un archivo de texto plano propuesto que señala a los modelos de IA tu contenido más importante en una forma limpia y estructurada. Su adopción aún es incipiente y no sustituye a un contenido sólido y rastreable.
M
MCP (Model Context Protocol)
El Model Context Protocol es un estándar abierto que permite a los asistentes de IA conectarse a herramientas y fuentes de datos externas de forma consistente. Es la manera en que un modelo puede llamar de forma segura a un servicio como SEOcrawl para obtener datos SEO en vivo en lugar de adivinar a partir de su entrenamiento.
Monitorización de menciones de marca
La monitorización de menciones de marca en la búsqueda con IA consiste en seguir cuándo, dónde y cómo nombran los motores de IA a tu marca en sus respuestas. Es la base de cualquier estrategia de visibilidad en IA, ya que no puedes mejorar lo que no puedes ver.
Motor de respuestas
Un motor de respuestas es cualquier sistema que responde a una consulta con una respuesta sintetizada en lugar de una lista de enlaces: ChatGPT, Perplexity, Gemini y las AI Overviews de Google cumplen esa definición. El término enmarca el cambio estratégico que hay detrás del AEO.
Multimodal
Multimodal describe a un modelo capaz de procesar más de un tipo de entrada —texto, imágenes, audio o vídeo— dentro del mismo sistema. Es la razón por la que los motores de IA pueden ahora leer una captura de pantalla o un gráfico, y no solo palabras.
P
Prompt
Un prompt es la instrucción o pregunta que le das a un modelo de IA para que produzca una respuesta. En la búsqueda con IA, los prompts que escriben los usuarios reales son las consultas para las que intentas aparecer.
Prompt tracking
El prompt tracking consiste en monitorizar cómo responden los motores de IA a un conjunto definido de prompts a lo largo del tiempo: qué marcas mencionan, qué fuentes citan y cómo cambia todo eso. Es el equivalente del seguimiento de rankings en la búsqueda con IA.
Q
Query fan-out
El query fan-out es la técnica por la que un motor de IA descompone una pregunta del usuario en varias subconsultas, las ejecuta en paralelo y sintetiza los resultados en una única respuesta. Entenderlo explica por qué cubrir un tema a fondo gana a apuntar a una única frase exacta.
R
RAG (Retrieval-Augmented Generation)
RAG es una arquitectura en la que un modelo recupera documentos relevantes en el momento de responder y los usa para generar una respuesta fundamentada y con fuentes. La mayoría de experiencias de búsqueda con IA son alguna forma de RAG, y por eso ser recuperable lo es todo.
Rastreador de IA
Un rastreador de IA es un bot operado por una empresa de IA para recopilar contenido web con fines de entrenamiento o de recuperación en vivo —por ejemplo GPTBot, ClaudeBot, Google-Extended o PerplexityBot—. Tu robots.txt controla a cuáles de ellos permites acceder a tu sitio.
Reranking
El reranking es un paso de segunda pasada que reordena por relevancia los pasajes recuperados antes de que el modelo escriba su respuesta. Es una de las razones por las que el pasaje más útil y mejor ajustado suele ganar al meramente popular.
T
Token
Un token es la unidad de texto que un modelo lee y genera: aproximadamente una palabra o un fragmento de palabra. Los tokens importan porque definen los límites de contexto de un modelo y el coste de ejecutarlo.
Z
Zero-click
Un resultado zero-click es aquel en el que el usuario obtiene su respuesta directamente en la interfaz y nunca visita una web. Las respuestas de IA han disparado las búsquedas zero-click, y por eso la visibilidad dentro de la respuesta —citaciones y menciones— importa ahora tanto como el clic.
Autor: David Kaufmann

Llevo más de 10 años completamente obsesionado con el SEO — y sinceramente, no lo cambiaría por nada.
Mi carrera dio un salto cuando trabajé como especialista SEO sénior en Chess.com — uno de los 100 sitios web más visitados de todo Internet. Operar a esa escala, con millones de páginas, decenas de idiomas y uno de los SERPs más competitivos, me enseñó cosas que ningún curso podría. Esa experiencia cambió mi perspectiva sobre lo que significa hacer SEO de verdad — y se convirtió en la base de todo lo que he construido desde entonces.
De esa experiencia nació SEO Alive — una agencia para marcas que se toman en serio el crecimiento orgánico. No vendemos dashboards ni informes mensuales. Construimos estrategias que realmente mueven la aguja, combinando lo mejor del SEO clásico con el nuevo mundo del Generative Engine Optimization (GEO) — asegurando que tu marca aparezca no solo en los enlaces azules de Google, sino también en las respuestas generadas por IA que ChatGPT, Perplexity y Google AI Overviews entregan a millones de personas cada día.
Y como no encontré una herramienta que gestionara ambos mundos correctamente, construí la mía propia — SEOcrawl, una plataforma de inteligencia SEO empresarial que une rankings, auditorías técnicas, monitorización de backlinks, salud del crawl y seguimiento de visibilidad de marca en IA, todo en un solo lugar. Es la plataforma que siempre deseé que existiera.
Descubre más contenido de este autor

Si no rastreas tu visibilidad en IA, estás volando a ciegas en un canal que ya genera más de mil millones de visitas de referencia al mes. Aquí tienes un marco de 5 pasos para rastrear tu marca en ChatGPT, Perplexity, Gemini y más allá.

Las herramientas de IA responden a las preguntas de tus clientes sin enlazarte nunca. La Optimización para Motores de Respuesta (AEO) es cómo las marcas consiguen ser citadas por ChatGPT, Perplexity y los AI Overviews de Google: aquí tienes qué es, cómo funciona y cómo medir resultados.