Dicionário de IA: glossário de termos de pesquisa por IA e GEO

MCP, RAG, grounding, share of voice em IA… a linguagem da pesquisa por IA evolui depressa, e um termo que não existia há um ano pode estar por todo o lado hoje. Este glossário define os termos de IA e GEO que todo o profissional de marketing e SEO precisa de conhecer.
Se o nosso glossário de SEO é o dicionário da pesquisa clássica, pense neste como o seu complemento para a era generativa — as palavras de que precisa para perceber como o ChatGPT, o Gemini, o Perplexity e as AI Overviews da Google encontram, leem e citam conteúdo na prática. Cada entrada é curta e prática e, sempre que escrevemos um guia completo, ligamos diretamente a ele para que possa aprofundar.
A passagem do ranking de links para a geração de respostas trouxe todo um vocabulário novo, em grande parte emprestado do machine learning. Não precisa de um curso de ciência de dados para trabalhar nesta área, mas precisa de saber o que as pessoas querem dizer quando falam de embeddings, grounding ou query fan-out. Guarde esta página nos favoritos e comece a falar a linguagem da pesquisa por IA com fluência.
Este glossário é mantido por David Kaufmann e pela equipa da SEOcrawl — as pessoas que monitorizam, todos os dias, como os motores de IA citam as marcas.
A
AEO (Answer Engine Optimization)
A Answer Engine Optimization é a prática de otimizar conteúdo para que os motores de resposta por IA o selecionem como fonte de uma resposta direta. Está estreitamente ligada ao GEO, com a ênfase em ser a resposta, em vez de ser um dos dez links azuis.
Agente (agente de IA)
Um agente de IA é um sistema que usa um modelo de linguagem para executar ações — chamar ferramentas, navegar ou concluir tarefas em vários passos — em vez de apenas devolver texto. Os agentes são a razão pela qual protocolos como o MCP importam: precisam de uma forma segura e padronizada de aceder a dados e serviços externos.
AI Mode
O AI Mode é a experiência de pesquisa conversacional e gerada por IA da Google, onde uma interface em estilo de chat responde diretamente a perguntas de seguimento. As aparições dentro do AI Mode não podem ser medidas como os rankings clássicos, embora os cliques que gera possam ser monitorizados em analítica.
AI Overview
Uma AI Overview é o resumo gerado por IA que a Google coloca no topo de muitos resultados de pesquisa, reunindo informação de várias fontes e citando-as. Conquistar um lugar entre essas fontes citadas é um objetivo central do GEO.
Alucinação
Uma alucinação é uma afirmação confiante mas falsa ou inventada, produzida por um modelo de IA. Conteúdo forte, bem estruturado e citável reduz a probabilidade de um motor inventar detalhes sobre a sua marca em vez de recorrer aos factos corretos.
B
Base de dados vetorial
Uma base de dados vetorial armazena embeddings e encontra as correspondências mais próximas de uma consulta pelo significado, em vez de por palavras-chave exatas. É o motor de recuperação por trás da pesquisa semântica e da maioria dos sistemas RAG.
C
Chunking
O chunking é o processo de dividir o conteúdo em passagens mais pequenas para que um sistema de recuperação consiga indexar e obter o trecho mais relevante. Uma estrutura clara — secções curtas, cabeçalhos descritivos, parágrafos autónomos — torna o conteúdo mais fácil de dividir em chunks e de recuperar.
Citação
Uma citação de IA é uma referência ao seu site ou marca dentro de uma resposta gerada por IA, apresentada como fonte com link, nota de rodapé ou menção inline. As citações são, para a pesquisa por IA, o que os rankings são para o SEO clássico: a unidade de visibilidade pela qual está a competir.
Crawler de IA
Um crawler de IA é um bot operado por uma empresa de IA para recolher conteúdo da web para treino ou recuperação em tempo real — por exemplo, o GPTBot, o ClaudeBot, o Google-Extended ou o PerplexityBot. O seu robots.txt controla quais deles podem aceder ao seu site.
D
Dados de treino
Os dados de treino são o conjunto de texto e outros conteúdos com que um modelo aprendeu antes de ser implementado. Se a sua marca e os seus factos estiverem bem representados pela web, é mais provável que se reflitam naquilo que um modelo já "sabe".
E
Embedding
Um embedding é uma representação numérica de texto (ou imagens) que capta o significado sob a forma de uma lista de números, para que um modelo possa medir o grau de semelhança entre dois conteúdos. Os embeddings são a base da pesquisa semântica e da recuperação dentro dos sistemas de IA.
Entidade
Uma entidade é uma coisa distinta e identificável — uma pessoa, marca, produto ou lugar — que os motores reconhecem e relacionam num grafo de conhecimento. Ser reconhecida como uma entidade clara ajuda os motores de IA a associar a sua marca aos temas certos e a mencioná-la com confiança.
F
Fine-tuning
O fine-tuning é o processo de continuar a treinar um modelo base com um conjunto de dados focado para especializar o seu comportamento ou conhecimento. É distinto da recuperação: o fine-tuning incorpora a informação no modelo, enquanto a recuperação a obtém no momento da resposta.
G
GEO (Generative Engine Optimization)
A Generative Engine Optimization é a disciplina de otimizar o seu conteúdo e a presença da sua marca para que os motores de IA generativa o mencionem e o citem. Estende o SEO ao ChatGPT, ao Gemini, ao Perplexity e às AI Overviews.
Grafo de conhecimento
Um grafo de conhecimento é um mapa estruturado de entidades e das relações entre elas. Os motores de IA apoiam-se nos grafos de conhecimento para desambiguar marcas e decidir em que factos confiar a seu respeito.
Grounding
O grounding acontece quando um motor de IA baseia a sua resposta em fontes recuperadas e verificáveis, em vez de apenas nos parâmetros com que foi treinado. As respostas com grounding são as que têm maior probabilidade de incluir citações — e é precisamente por isso que importa ser uma fonte recuperável e fiável.
L
LLM (Large Language Model)
Um large language model é um modelo de IA treinado com enormes quantidades de texto para prever e gerar linguagem — o motor por trás do ChatGPT, do Claude, do Gemini e de outros. No final, tudo na pesquisa por IA assenta num deles.
llms.txt
O llms.txt é um ficheiro de texto simples proposto que aponta os modelos de IA para o seu conteúdo mais importante de forma limpa e estruturada. A adoção ainda está a surgir e não substitui um conteúdo sólido e rastreável.
M
MCP (Model Context Protocol)
O Model Context Protocol é uma norma aberta que permite aos assistentes de IA ligarem-se a ferramentas e fontes de dados externas de forma consistente. É a forma como um modelo pode chamar de forma segura um serviço como a SEOcrawl para obter dados de SEO em tempo real, em vez de adivinhar a partir do treino.
Monitorização de menções da marca
A monitorização de menções da marca na pesquisa por IA significa acompanhar quando, onde e como os motores de IA nomeiam a sua marca nas suas respostas. É a base de qualquer estratégia de visibilidade em IA, já que não se pode melhorar aquilo que não se consegue ver.
Motor de respostas
Um motor de respostas é qualquer sistema que responde a uma consulta com uma resposta sintetizada em vez de uma lista de links — o ChatGPT, o Perplexity, o Gemini e as AI Overviews da Google são todos exemplos disso. O termo enquadra a mudança estratégica que está por trás do AEO.
Multimodal
Multimodal descreve um modelo capaz de processar mais do que um tipo de entrada — texto, imagens, áudio ou vídeo — dentro do mesmo sistema. É a razão pela qual os motores de IA conseguem agora ler uma captura de ecrã ou um gráfico, e não apenas palavras.
P
Prompt
Um prompt é a instrução ou a pergunta que dá a um modelo de IA para produzir uma resposta. Na pesquisa por IA, os prompts que os utilizadores reais escrevem são as consultas para as quais está a tentar aparecer.
Prompt tracking
O prompt tracking consiste em monitorizar como os motores de IA respondem a um conjunto definido de prompts ao longo do tempo — que marcas mencionam, que fontes citam e como isso muda. É o equivalente, na pesquisa por IA, à monitorização de rankings.
Q
Query fan-out
O query fan-out é a técnica em que um motor de IA decompõe uma pergunta do utilizador em várias subconsultas, as executa em paralelo e sintetiza os resultados numa única resposta. Compreendê-lo explica por que razão cobrir um tema de forma exaustiva supera segmentar uma frase exata.
R
RAG (Retrieval-Augmented Generation)
O RAG é uma arquitetura em que um modelo recupera documentos relevantes no momento da resposta e os usa para gerar uma resposta fundamentada e com fontes. A maioria das experiências de pesquisa por IA é uma forma de RAG — e é por isso que ser recuperável é tudo o que conta.
Reranking
O reranking é um passo de segunda passagem que reordena as passagens recuperadas por relevância antes de o modelo escrever a sua resposta. É uma das razões pelas quais a passagem mais útil e mais pertinente costuma vencer a meramente popular.
S
Share of voice em IA
O share of voice em IA é a percentagem de respostas de IA, para um tema ou conjunto de prompts, em que a sua marca aparece em comparação com os concorrentes. É a métrica de referência para medir a visibilidade em IA e para fazer benchmarking face aos rivais.
T
Token
Um token é a unidade de texto que um modelo lê e gera — aproximadamente uma palavra ou um fragmento de palavra. Os tokens importam porque definem os limites de contexto de um modelo e o custo de o executar.
Z
Zero-click
Um resultado zero-click é aquele em que o utilizador obtém a resposta diretamente na interface e nunca visita um site. As respostas de IA fizeram subir o zero-click, e é por isso que a visibilidade dentro da resposta — citações e menções — passou a importar tanto como o clique.
Autor: David Kaufmann

Passei os últimos 10 e tantos anos completamente obcecado por SEO — e, sinceramente, não quereria que fosse de outra forma.
A minha carreira atingiu um novo patamar quando trabalhei como Senior SEO Specialist na Chess.com — um dos 100 sites mais visitados de toda a internet. Operar nessa escala, em milhões de páginas, dezenas de idiomas e numa das SERPs mais competitivas que existem, ensinou-me coisas que nenhum curso ou certificação jamais poderia. Essa experiência mudou a minha perspetiva sobre o que é realmente um grande trabalho de SEO — e tornou-se a base de tudo o que construí desde então.
Foi a partir dessa experiência que fundei a SEO Alive — uma agência para marcas que levam a sério o crescimento orgânico. Não estamos aqui para vender dashboards e relatórios mensais. Estamos aqui para construir estratégias que realmente fazem a diferença, combinando o melhor do SEO clássico com o novo e empolgante mundo da Generative Engine Optimization (GEO) — garantindo que a tua marca apareça não só nos links azuis do Google, mas também dentro das respostas geradas por AI que o ChatGPT, o Perplexity e o Google AI Overviews entregam a milhões de pessoas todos os dias.
E como não consegui encontrar uma ferramenta que lidasse corretamente com esses dois mundos, construí uma eu mesmo — a SEOcrawl, uma plataforma enterprise de SEO intelligence que reúne rankings, auditorias técnicas, monitoramento de backlinks, saúde do crawl e tracking de visibilidade de marca em AI, tudo num só lugar. É a plataforma que sempre desejei que existisse.
Descubra mais conteúdos deste autor

Se não está a rastrear a visibilidade em IA, está a navegar às cegas num canal que já gera mais de mil milhões de visitas de referência por mês. Aqui está um framework de 5 passos para rastrear a sua marca no ChatGPT, Perplexity, Gemini e além.

As ferramentas de IA estão a responder às perguntas dos teus clientes sem nunca te referenciarem. A Otimização para Motores de Resposta (AEO) é como as marcas conseguem ser citadas pelo ChatGPT, Perplexity e Google AI Overviews — eis o que é, como funciona e como medir os resultados.