Como encontrar o sitemap de um site

Encontrar o sitemap de qualquer site é relativamente fácil e aqui vamos ajudá-lo a cumprir esta missão. Vamos começar pelo formato de sitemap mais comum, que é o XML, e depois abordaremos alguns outros. Primeiro, vamos começar pelo básico.
O que é um Sitemap?
Um sitemap XML é uma lista das páginas de um site destinada a ajudar os diferentes motores de busca. Ele fornece informação importante sobre os URLs do seu site, incluindo páginas, vídeos, imagens, ficheiros e qual a sua relação. Juntamente com as páginas, os sitemaps XML também incluem metadados adicionais sobre cada URL:
- data da última atualização- com que frequência muda e - a sua prioridade em relação às outras páginas.
No que toca às boas práticas de SEO, um sitemap deve ser otimizado para incluir apenas conteúdo indexável e de qualidade. Qualquer página quebrada (404), redirecionada ou duplicada dentro dele pode confundir os motores de busca.
O sitemap é como um esboço de um site. É construído num formato de código e normalmente parece-se com isto:

Ou assim:

Porque é que precisa de encontrar um Sitemap?
Já cobrimos as noções básicas sobre sitemaps, incluindo a sua principal finalidade. Vejamos agora porque é que poderemos querer encontrar estes ficheiros logo à partida.
Como discutimos acima, os sitemaps são uma forma insubstituível e simples de informar os motores de busca e, em particular, os seus crawlers (ex. Googlebot) sobre o conteúdo importante do nosso site.
Antes de mais, pode querer verificar se possui sequer um sitemap XML. Se tiver um, o próximo passo é inspecioná-lo e verificar se está corretamente criado e se contém a informação certa.
Por fim, se não tiver um sitemap, pode querer criar um e submetê-lo aos motores de busca. Tenha em conta que os sitemaps XML não são, de forma alguma, obrigatórios. Ainda assim, ajudam os crawlers de pesquisa a encontrar, indexar e, em última instância, classificar novos sites e páginas de uma forma mais rápida.
Chegou a hora de mergulhar fundo no trabalho de detetive e encontrar esses sitemaps!
Pronto? Vamos lá!
Formas simples de encontrar o seu Sitemap
Vamos começar a nossa jornada com algumas das formas mais fáceis de encontrar o sitemap de um site.
1) Verificar manualmente as localizações comuns de sitemaps XML
Uma das formas mais comuns (e simples) de localizar o sitemap XML de um site é verificar manualmente algumas localizações padrão. Isto é extremamente simples e tudo o que precisa de fazer é introduzir o URL do seu site no browser e depois tentar algumas variações diferentes. Deixe-me mostrar-lhe:
Esta é a localização mais popular, mas não a única. Por isso, se não tivermos sorte na primeira tentativa, aqui ficam mais algumas verificações rápidas para experimentar:
- /sitemap_index.xml (que é o índice de todos os sitemaps, caso um site tenha mais do que um).
Este é o caso do nosso próprio sitemap XML neste blog. Deixe-me mostrar-lhe:

E é assim que se apresenta:

Basicamente, são todos sitemaps separados divididos pelo tipo de posts que têm dentro.
Agora, se ainda não tivermos sorte, vamos tentar mais algumas opções:
- /sitemap-index.xml- /sitemap.php- /sitemap.txt- /sitemap.xml.gz- /sitemap/- /sitemap/sitemap.xml- /sitemapindex.xml- /sitemap/index.xml- /sitemap1.xml
Nota: os ficheiros XML são apenas uma das formas de descrever um sitemap. Existem também os formatos RSS e Atom.
Por isso, precisamos de adicionar mais algumas localizações possíveis de sitemap:
- /rss/- /rss.xml- /atom.xml
Falaremos mais sobre eles mais à frente.
Só para confirmar: devemos colocar o nome de domínio do site antes da "/" enquanto experimentamos as várias alternativas.
2) Verificar o ficheiro Robots.txt
Se ainda está connosco, isso significa que ou não conseguiu encontrar o ficheiro, que é o principal objetivo do nosso artigo, ou é apenas curioso e apaixonado por aprender mais.
Na verdade, seja qual for o motivo exato, tenho boas notícias para si - Vamos continuar a nossa jornada com outra dica muito simples.
Robots.txt é um ficheiro especial conhecido dos SEOs (e também dos programadores) que fornece diretivas úteis aos crawlers dos motores de busca. Além disso, este é também o local onde, muito frequentemente, pode encontrar uma ligação para o sitemap de um site.
A ideia é que, uma vez que os motores de busca visitam estes ficheiros robots.txt, adicionar aí uma ligação para o sitemap faz todo o sentido. Dessa forma, será mais fácil para eles detetar o sitemap logo à partida e rastrear o site.
Está pronto para outra boa notícia?! Aqui vai: para aceder ao ficheiro robots.txt de um site basta adicionar /robots.txt ao seu nome de domínio no browser e carregar em "Enter". Isto é semelhante ao passo anterior, onde adicionávamos as diferentes rotas possíveis de sitemap.
O que funciona melhor do que um exemplo da vida real? Veja o endereço URL do nosso próprio ficheiro robots.txt:
https://seocrawl.com/robots.txt
É um ficheiro pequeno, mas simples e útil, com algumas funções importantes. Caso já o tenha aberto, conseguirá ver quase instantaneamente a pequena pérola que procura: o ficheiro do sitemap:

Voilà! Prometi-lhe que seria fácil :)
3) Verificar o Google Search Console
Ok, ainda não encontrou o sitemap? Sem problema! Temos mais dicas para si que nos vão ajudar a descobrir o caminho.
Deixe-me mostrar-lhe outra forma fácil e rápida.
O Google Search Console (também conhecido no passado como Webmaster Tools) é mais um sítio onde encontrar o caminho que procuramos. Claro que, para isto ser possível, tem de ser proprietário do site ou ter-lhe sido concedido acesso.
Se cumprir um destes critérios, o próximo passo é iniciar sessão no GSC e, a partir do menu do lado esquerdo, escolher Sitemaps:

Agora, caso o sitemap (ou sitemaps) já tenha sido submetido por alguém no passado, poderá vê-lo imediatamente:

Juntamente com o endereço URL exato do sitemap, há informação adicional como o tipo de sitemap (ficheiros de índice que contêm outros sitemaps no seu interior ou sitemaps normais com as páginas do site), quando foi submetido, última leitura, estado e quantos URLs contém.
DICA: Se leva o SEO a sério e pretende melhorar o desempenho orgânico do seu site, o Google Search Console é uma ferramenta indispensável. Os insights que pode obter a partir dele são inúmeros.
Além disso, um bónus extra é que ter o GSC permite-lhe experimentar a nossa poderosa ferramenta: a SEOcrawl
4) Verificar o Bing Webmaster Tools
A boa notícia é que o Bing Webmaster Tools funciona praticamente da mesma forma que o Google Search Console. Não é surpreendente, já que este último costumava chamar-se Google Webmaster Tools e têm muito em comum.
Novamente, precisa de iniciar sessão e depois navegar até à barra lateral esquerda, onde terá disponível a secção "Sitemaps".

Clique nela e, caso já houvesse um sitemap/sitemaps submetidos, poderá explorá-los mais a fundo.

Formas avançadas de encontrar o seu Sitemap
Ainda connosco? Ok, isso significa que ou continua à procura da localização desse precioso ficheiro de sitemap, ou é muito corajoso por entrar na secção avançada. Em ambos os casos, quero dar-lhe os parabéns por ter chegado tão longe e desejar-lhe sorte :)
Prometo que não será assim tão complicado e assustador! Vamos lá!
5) Usar operadores de pesquisa do Google
Os operadores de pesquisa do Google (também conhecidos como comandos) podem ser muito poderosos para vários objetivos de SEO (ex. encontrar oportunidades de link building, ideias de conteúdo, descobrir problemas técnicos, e mais). No entanto, neste caso, vamos usá-los para encontrar o sitemap XML do site que estamos a analisar.
Para isso, vamos tirar partido do comando "filetype:". Pode ser mesmo útil quando o combinamos com o comando "site:". Basicamente, a combinação de ambos irá procurar tipos de ficheiros específicos apenas no site que quisermos.
Exemplo: site:chess.com filetype:xml
E aqui está o que esta pesquisa irá trazer no Google:

Aqui está! Todos os sitemaps indexados do site são mostrados no Google e podemos explorá-los mais a fundo.
Caso apareçam alguns resultados irrelevantes, pode refinar ainda mais a sua pesquisa. Desta vez vamos adicionar o operador "inurl" ao nosso arsenal.
Por exemplo: site:uefa.com filetype:xml inurl:sitemap

Nota: como mencionámos acima, os sitemaps também podem ser ficheiros de texto. Para os encontrar, podemos fazer uma pesquisa semelhante, mas com uma extensão diferente.
Por exemplo: site:UrlDoSite inurl:sitemap filetype:txt
E isto resultará no seguinte:

DICA: Estes comandos irão revelar a localização do sitemap apenas se estiver indexado pelo Google. Alguns plugins de WP que criam sitemaps adicionam automaticamente a tag no follow, no index aos Sitemaps. Portanto, se acabar sem obter resultados, não se preocupe!
Vamos continuar com a próxima ideia.

6) Usar uma ferramenta online
Outra técnica é experimentar com uma ferramenta online como o SEO Site Checkup, onde só precisa de colar o URL do seu site e carregar em Checkup. Depois irá obter algo como isto:Nota: A forma como esta ferramenta funciona é verificar as localizações padrão de sitemap que mencionámos anteriormente (sitemap.xml, sitemap1.xml, sitemapindex.xml e por aí fora). Por isso, pode não encontrar o seu site noutros casos específicos.
7) Verificar o CMS do site
Dependendo do sistema de gestão de conteúdos em que o site está a correr, os sitemaps XML podem estar localizados em sítios diferentes. A boa notícia é que os CMS mais populares têm localizações por defeito a partir das quais pode iniciar a sua pesquisa.
Primeiro, precisamos de identificar o CMS do site. É um processo bastante simples e podemos usar tanto ferramentas online como extensões de browser.
Por exemplo, um addon útil é o Built With, que identifica não só o CMS, mas muitos mais softwares e programas que o site está a usar. Eis como apresenta a informação que procura:

Se preferir uma ferramenta online, uma solução possível é o WhatCMS:

Uma alternativa é o CMS Detect:

Agora, quando sabemos o CMS exato, vamos explorar alguns dos sistemas de gestão de conteúdos mais populares e onde costumam guardar os ficheiros XML.
Wordpress
Antes de 2020, a forma como os sitemaps eram criados era principalmente através de plugins. No entanto, hoje em dia, com a funcionalidade integrada do WP, devem estar localizados em /wp-sitemap.xml.
Ainda assim, caso o site que está a analisar esteja a usar um plugin para a criação do sitemap, pode experimentar algumas das seguintes localizações:
- /sitemap.xml- /tag-sitemap.xml- /sitemap_index/xml- /category-sitemap.xml
Em alternativa, pode verificar as definições do plugin e encontrar aí o caminho.
Wix, Shopify, Joomla, Squarespace, Magento
A boa notícia é que todos estes geram automaticamente os sitemaps XML para os seus utilizadores. Por isso, a localização por defeito (se não for modificada adicionalmente) é: /sitemap.xml
Com a nota de que o nome de domínio vai antes da parte "/".
BÓNUS: Um bookmarklet para descoberta instantânea do Sitemap.xml
Caso seja fã da produtividade e de poupar tempo em cada pequena tarefa (não somos todos nós SEOs assim?!), então poderá achar útil um rápido bookmarklet para verificar instantaneamente o sitemap XML de um site.
Só precisa de adicionar este código javascript:
javascript:void(location.href='http://' + location.host + '/sitemap.xml')
Adicione-o aos favoritos e, de cada vez que clicar nele, abrirá o ficheiro de Sitemap caso este se encontre na localização por defeito /sitemap.xml.
Rápido e fácil!
Encontrar outros tipos de Sitemaps
Falámos sobretudo de sitemaps XML, uma vez que são o formato mais comum para mostrar aos crawlers o que se passa no seu domínio. Ainda assim, vale a pena mencionar os outros tipos que também podem ser encontrados em alguns sites.
- HTML. Estes costumam ser feitos para facilitar a vida aos utilizadores e são muito úteis especialmente para sites maiores.
Por exemplo, o Ebay fornece aos seus visitantes um "mapa" virtual com as principais páginas e categorias: https://pages.ebay.com/sitemap.html

-
RSS. Em alguns casos, os sites usam um feed RSS como sitemap, que costuma estar localizado em: /rss/ ou /rss.xml.
-
Atom. O mesmo se aplica ao feed Atom e normalmente pode encontrá-lo como: /atom.xml- TXT. Este é um ficheiro de texto padrão, tal como já discutimos num exemplo. Localização: /sitemap.txt
Sem sitemap? O que fazer neste caso?
Depois de percorrermos as diferentes opções para encontrar um sitemap, é bom dizer umas palavras sobre o que fazer se ainda não houver um sitemap criado. Este será o caso da maioria dos sites novinhos em folha que estão online há pouco tempo. Ou de alguns sites muito pequeninos.
Além disso, tenha em conta que nem todos os sites precisam de sitemaps. Se o site tiver apenas algumas páginas, ficará bem sem um.
Ainda assim, se estiver disposto a criar o seu sitemap XML, pode simplesmente usar um plugin compatível com o seu sistema CMS. Alguns bons exemplos para WP são:
- Rank Math Sitemap Plugin- WP Sitemap Plugin- Google XML Sitemaps- WordPress SEO by Yoast
Em alternativa, pode criar um sitemap manualmente ou usar um crawler para percorrer o seu site e exportar um sitemap para carregar.
Em resumo:
Espero que estas dicas o tenham ajudado a aprofundar no mundo dos Sitemaps e que esteja agora mais familiarizado com como funcionam, porque é que precisamos deles… e, claro, como encontrá-los.
Diga-nos nos comentários se há mais alguma coisa que gostaria de saber, ou simplesmente para partilhar a sua experiência :)
Boa sorte!
Autor: Ognian Mikov

O SEO entrou na minha vida em 2012 e, desde então, sou completamente apaixonado por ele. Para mim é muito mais do que um trabalho: é, ao mesmo tempo, uma paixão e um hobby que me mantém motivado para continuar a aprender e a melhorar. Seja a investigar novos temas, a criar conteúdos ou a mergulhar em ajustes técnicos, fascina-me sempre o vasto mundo do marketing digital e as inúmeras oportunidades que existem para melhorar o desempenho de um site.
Em 2021 juntei-me à SEO Alive e à SEOcrawl — a minha primeira empresa em regime remoto — onde tenho podido desenvolver novas competências e trabalhar em projetos entusiasmantes. E, acima de tudo, tive a oportunidade de conhecer colegas incríveis e aprender com eles; muitos tornaram-se também amigos.
Sou licenciado em Marketing e tenho um mestrado em Relações Públicas e Publicidade. Nos tempos livres, gosto de estar com a minha filha e também de jogar e ver xadrez, futebol (Само Левски & Més que un club) e póquer.
Descubra mais conteúdos deste autor
