Prompt Tracking
Mesure et optimise la visibilité de ta marque dans ChatGPT et l'IA.
Claude
Surveille comment Claude mentionne ta marque et tes concurrents.
Soon
AI Tracker
Mesure l'impact réel de l'IA sur ton SEO.
Gemini
Découvre comment Gemini te positionne face à la concurrence.
Soon
ChatGPT
Surveille comment ChatGPT mentionne ta marque.
Soon
Perplexity
Analyse la visibilité de ta marque dans Perplexity AI.
Soon
TarifsDemo

Comment trouver le sitemap d'un site web

Comment trouver le sitemap d'un site web
Ognian Mikov
Tutoriels SEO
13 min read

Trouver le sitemap de n'importe quel site web est relativement facile et nous allons vous aider à accomplir cette mission. Nous commencerons par le format de sitemap le plus courant, qui est XML, puis nous en couvrirons quelques autres. Tout d'abord, commençons par les bases.

Qu'est-ce qu'un Sitemap ?

Un sitemap XML est une liste des pages d'un site web destinée à aider les différents moteurs de recherche. Il fournit des informations importantes sur les URL de votre site web, notamment les pages, vidéos, images, fichiers et leurs relations. En plus des pages, les sitemaps XML incluent également des métadonnées supplémentaires sur chaque URL :

  • date de dernière mise à jour- fréquence des changements et - sa priorité par rapport aux autres pages.

En matière de bonnes pratiques SEO, un sitemap doit être optimisé pour n'inclure que du contenu indexable et de qualité. Toute page cassée (404), redirigée ou dupliquée à l'intérieur pourrait perturber les moteurs de recherche.

Le sitemap est comme un plan d'un site web. Il est construit dans un format de code et ressemble généralement à ceci :

Sitemap SEOcrawl
Sitemap SEOcrawl

Ou comme ceci :

Sitemap XML
Sitemap XML

Pourquoi avez-vous besoin de trouver un Sitemap ?

Nous avons déjà couvert les bases des sitemaps, y compris leur objectif principal. Voyons maintenant pourquoi nous pourrions vouloir trouver ces fichiers en premier lieu.

Comme nous l'avons évoqué plus haut, les sitemaps sont un moyen irremplaçable et simple d'informer les moteurs de recherche et en particulier leurs robots d'exploration (ex. Googlebot) sur le contenu important de notre site web.

Tout d'abord, vous voudrez peut-être vérifier si vous avez un sitemap XML. Si vous en avez un, la prochaine étape est de l'inspecter et de voir s'il a été correctement créé et s'il contient les bonnes informations.

Enfin, si vous n'avez pas de sitemap, vous voudrez peut-être en créer un et le soumettre aux moteurs de recherche. Sachez que les sitemaps XML ne sont en aucun cas obligatoires. Pourtant, ils aident les robots d'exploration à trouver, indexer et finalement classer les nouveaux sites web et pages plus rapidement.

Il est maintenant temps de plonger dans le travail de détective et de trouver ces sitemaps !

Prêts ? Allons-y !

Des moyens simples de trouver votre Sitemap

Commençons notre parcours avec quelques-unes des manières les plus faciles de trouver le sitemap d'un site web.

1) Vérifier manuellement les emplacements courants des Sitemaps XML

L'une des façons les plus courantes (et simples) de localiser le sitemap XML d'un site web est de vérifier manuellement quelques emplacements standards. C'est extrêmement simple et tout ce que vous avez à faire est d'entrer l'URL de votre site web dans le navigateur et d'essayer ensuite quelques variantes différentes. Laissez-moi vous montrer :

C'est l'emplacement le plus populaire, mais pas le seul. Par conséquent, si nous n'avons pas de chance lors de notre première tentative, voici quelques vérifications rapides supplémentaires à essayer :

  • /sitemap_index.xml (qui est l'index de tous les sitemaps au cas où un site web en aurait plus d'un).

C'est le cas avec notre propre sitemap XML sur ce blog. Laissez-moi vous montrer :

URL du sitemap SEOcrawl
URL du sitemap SEOcrawl

Et voici à quoi cela ressemble :

Liste des sitemaps de SEOcrawl
Liste des sitemaps de SEOcrawl

Essentiellement, ce sont tous des sitemaps distincts divisés selon le type d'articles qu'ils contiennent.

Maintenant, si nous n'avons toujours pas de chance, essayons d'autres options :

  • /sitemap-index.xml- /sitemap.php- /sitemap.txt- /sitemap.xml.gz- /sitemap/- /sitemap/sitemap.xml- /sitemapindex.xml- /sitemap/index.xml- /sitemap1.xml

Remarque : les fichiers XML ne sont qu'une des façons de décrire un sitemap. Il existe également des formats RSS et Atom.

Nous devons donc ajouter quelques emplacements de sitemaps possibles supplémentaires :

  • /rss/- /rss.xml- /atom.xml

Nous en parlerons davantage plus tard.

Juste pour confirmer - nous devons mettre le nom de domaine des sites web avant le « / » lors de l'essai des différentes alternatives.

2) Vérifier le fichier Robots.txt

Si vous êtes toujours avec nous, cela signifie soit que vous n'avez pas réussi à trouver le fichier, ce qui est l'objectif principal de notre article, soit que vous êtes simplement curieux et passionné d'en apprendre davantage.

En fait, quelle que soit la raison exacte, j'ai de bonnes nouvelles pour vous - Nous allons continuer notre parcours avec une autre astuce très simple.

Robots.txt est un fichier spécial connu des SEO (et aussi des programmeurs) qui fournit des directives utiles aux robots d'exploration des moteurs de recherche. De plus, c'est aussi l'endroit où vous pouvez très souvent trouver un lien vers le sitemap d'un site web.

L'idée est que puisque les moteurs de recherche visitent ces fichiers robots.txt, y ajouter un lien vers le sitemap est tout à fait logique. De cette façon, il leur sera plus facile de détecter le sitemap en premier lieu et d'explorer le site web.

Êtes-vous prêts pour une autre bonne nouvelle ?! La voici - pour accéder au fichier robots.txt d'un site web, il vous suffit d'ajouter /robots.txt à votre nom de domaine dans le navigateur et d'appuyer sur « Entrée ». Ceci est similaire à l'étape précédente où nous ajoutions les différentes routes de sitemap possibles.

Quoi de mieux qu'un exemple concret ? Voyez l'adresse URL de notre propre fichier robots.txt :

https://seocrawl.com/robots.txt

C'est un fichier minuscule mais simple et utile avec quelques fonctions importantes. Si vous l'avez déjà ouvert, vous pourrez voir presque instantanément le petit trésor que vous recherchez - le fichier sitemap :

Robots seocrawl
Robots seocrawl

Voilà ! Je vous avais promis que ce serait facile :)

3) Vérifier Google Search Console

D'accord, sitemap toujours pas trouvé ? Pas de problème ! Nous avons d'autres astuces pour vous qui nous aideront à trouver notre chemin.

Laissez-moi vous montrer une autre façon facile et rapide.

Google Search Console (également connu sous le nom de Webmaster Tools dans le passé) est un autre endroit pour trouver le chemin que nous recherchons. Bien sûr, pour que cela soit possible, vous devez être propriétaire du site web ou avoir reçu un accès.

Si vous répondez à l'un de ces critères, l'étape suivante consiste à vous connecter à GSC et, dans le menu de gauche, à choisir Sitemaps :

Sitemaps dans Google Search Console
Sitemaps dans Google Search Console

Maintenant, au cas où le sitemap (ou les sitemaps) aurait déjà été soumis par quelqu'un d'autre dans le passé, vous pourrez le voir immédiatement :

Sitemaps soumis
Sitemaps soumis

En plus de l'adresse URL exacte du sitemap, il y a des informations supplémentaires comme le type de sitemap (fichiers d'index contenant d'autres sitemaps ou sitemaps classiques avec les pages du site web), quand il a été soumis, la dernière lecture, le statut et combien d'URL il contient.

ASTUCE : si vous êtes sérieux au sujet du SEO et de l'amélioration des performances organiques de votre site web, Google Search Console est un outil indispensable. Les informations que vous pouvez en tirer sont nombreuses.

De plus, un bonus supplémentaire est que le fait d'avoir GSC vous permet d'essayer notre outil puissant - SEOcrawl

4) Vérifier Bing Webmaster Tools

La bonne nouvelle est que Bing Webmaster Tools fonctionne à peu près de la même manière que Google Search Console. Il n'est pas surprenant que ce dernier s'appelait autrefois Google Webmaster Tools car ils ont beaucoup en commun.

Encore une fois, vous devez vous connecter puis naviguer vers la barre latérale gauche, où vous aurez la section « Sitemaps » disponible.

Sitemaps dans Bing Webmaster Tools
Sitemaps dans Bing Webmaster Tools

Cliquez dessus, et au cas où un sitemap/des sitemaps auraient déjà été soumis, vous pourrez les explorer davantage.

Sitemaps soumis dans Bing Webmaster Tools
Sitemaps soumis dans Bing Webmaster Tools

Des moyens avancés de trouver votre Sitemap

Toujours avec nous ? D'accord, cela signifie que soit vous cherchez toujours cet emplacement précieux du fichier sitemap, soit vous êtes très courageux pour entrer dans la section avancée. Dans les deux cas, je veux vous féliciter d'être arrivé si loin et vous souhaiter bonne chance :)

Je promets que ce ne sera pas si compliqué et effrayant ! Allons-y !

5) Utiliser les opérateurs de recherche Google

Les opérateurs de recherche Google (également connus sous le nom de commandes) peuvent être très puissants pour divers objectifs SEO (ex. trouver des opportunités de netlinking, des idées de contenu, découvrir des problèmes techniques, et plus encore). Cependant, dans ce cas, nous les utiliserons pour trouver le sitemap XML du site web que nous examinons.

Pour cela, nous devrons tirer parti de la commande « filetype: ». Elle peut être vraiment utile lorsque nous la combinons avec la commande « site: ». En gros, la combinaison des deux recherchera des types de fichiers spécifiques uniquement dans le site web que nous voulons.

Exemple : site:chess.com filetype:xml

Et voici ce que cette recherche donnera dans Google :

Utiliser les opérateurs de recherche Google pour trouver des sitemaps
Utiliser les opérateurs de recherche Google pour trouver des sitemaps

Nous l'avons ! Tous les sitemaps indexés du site web sont affichés dans Google et nous pouvons les explorer davantage.

Au cas où il y aurait des résultats non pertinents affichés, vous pouvez affiner votre recherche encore plus. Cette fois, nous ajouterons l'opérateur « inurl » à notre arsenal.

Par exemple : site:uefa.com filetype:xml inurl:sitemap

Opérateur inurl pour trouver des sitemaps
Opérateur inurl pour trouver des sitemaps

Remarque : comme nous l'avons mentionné plus haut, les sitemaps peuvent également être des fichiers texte. Pour les trouver, nous pouvons faire une recherche similaire mais avec une extension différente.

Par exemple : site:URLduSite inurl:sitemap filetype:txt

Et cela donnera le résultat suivant :

Opérateur filetype pour trouver des sitemaps
Opérateur filetype pour trouver des sitemaps

ASTUCE : ces commandes révèleront l'emplacement du sitemap uniquement s'il est indexé par Google. Certains plugins WP qui créent des sitemaps ajoutent automatiquement la balise no follow, no index aux sitemaps. Donc, si vous n'obtenez aucun résultat, ne vous inquiétez pas !

Continuons avec l'idée suivante.

SEO Site checkup
SEO Site checkup

6) Utiliser un outil en ligne

Une autre technique consiste à essayer avec un outil en ligne comme SEO Site Checkup où il vous suffit de coller l'URL de votre site web et d'appuyer sur Checkup. Vous obtiendrez alors quelque chose comme ceci :Remarque : la façon dont cet outil fonctionne est de vérifier les emplacements standards des sitemaps que nous avons mentionnés précédemment (sitemap.xml, sitemap1.xml, sitemapindex.xml et ainsi de suite). Par conséquent, il peut ne pas trouver votre site web dans d'autres cas spécifiques.

7) Vérifier le CMS du site web

Selon le système de gestion de contenu sur lequel le site fonctionne, les sitemaps XML peuvent être situés à différents endroits. La bonne nouvelle est que les CMS les plus populaires ont des emplacements par défaut à partir desquels vous pourriez vouloir commencer votre recherche.

Tout d'abord, nous devons identifier le CMS du site web. C'est un processus assez simple et nous pouvons utiliser soit des outils en ligne, soit des extensions de navigateur.

Par exemple, un module complémentaire utile est Built With qui identifie non seulement le CMS mais bien d'autres logiciels et programmes que le site web utilise. Voici comment il affiche les informations que vous recherchez :

Module complémentaire Built With pour identifier le CMS
Module complémentaire Built With pour identifier le CMS

Si vous préférez un outil en ligne, une solution possible est WhatCMS :

What CMS pour SEOcrawl
What CMS pour SEOcrawl

Une alternative est CMS Detect :

CMS detect SEOcrawl
CMS detect SEOcrawl

Maintenant, quand nous connaissons le CMS exact, explorons certains des systèmes de gestion de contenu les plus populaires et où ils conservent généralement les fichiers XML.

Wordpress

Avant 2020, les sitemaps étaient principalement créés via des plugins. Cependant, de nos jours, avec la fonctionnalité intégrée de WP, ils devraient être situés à /wp-sitemap.xml.

Néanmoins, au cas où le site web que vous examinez utilise un plugin pour la création du sitemap, vous pouvez essayer avec certains des emplacements suivants :

  • /sitemap.xml- /tag-sitemap.xml- /sitemap_index/xml- /category-sitemap.xml

Alternativement, vous pouvez vérifier les paramètres du plugin et y trouver le chemin.

Wix, Shopify, Joomla, Squarespace, Magento

La bonne nouvelle est que tous ceux-ci génèrent automatiquement les sitemaps XML pour leurs utilisateurs. Par conséquent, l'emplacement par défaut (s'il n'est pas modifié en plus) est : /sitemap.xml

Avec la remarque que le nom de domaine va avant la partie « / ».

BONUS : un Bookmarklet pour une découverte instantanée de Sitemap.xml

Si vous êtes un adepte de la productivité et du gain de temps sur chaque petite tâche (ne le sommes-nous pas tous, nous les SEO ?!), alors vous pourriez trouver utile un bookmarklet rapide pour vérifier instantanément le sitemap XML d'un site web.

Il vous suffit d'ajouter ce code javascript :

javascript:void(location.href='http://' + location.host + '/sitemap.xml')

Ajoutez-le aux favoris et chaque fois que vous cliquerez dessus, il ouvrira le fichier Sitemap au cas où il serait situé à l'emplacement par défaut /sitemap.xml.

Rapide et facile !

Trouver d'autres types de Sitemaps

Nous avons principalement parlé des sitemaps XML car ils sont le format le plus courant pour montrer aux robots d'exploration ce qui se passe sur votre domaine. Néanmoins, il vaut la peine de mentionner les autres types qui peuvent également être trouvés sur certains sites web.

  • HTML. Ceux-ci sont généralement conçus pour faciliter la vie des utilisateurs et sont très utiles, en particulier pour les sites web plus importants.

Par exemple, Ebay fournit à ses visiteurs une « carte » virtuelle avec les pages principales et les catégories : https://pages.ebay.com/sitemap.html

Sitemap Html
Sitemap Html

  • RSS. Dans certains cas, les sites web utilisent un flux RSS comme sitemap, qui est généralement situé à : /rss/ ou /rss.xml.

  • Atom. Il en va de même pour le flux Atom et vous pouvez généralement le trouver à : /atom.xml- TXT. Il s'agit d'un fichier texte standard comme nous en avons déjà discuté un exemple. Emplacement : /sitemap.txt

Pas de sitemap ? Que faire dans ce cas ?

Après avoir passé en revue les différentes options pour trouver un sitemap, il est bon de dire quelques mots sur ce qu'il faut faire s'il n'y a pas de sitemap déjà créé. Ce sera le cas avec la plupart des tout nouveaux sites web qui sont en ligne depuis peu de temps. Ou certains sites très petits et minuscules.

Aussi, tenez compte du fait que tous les sites web n'ont pas besoin de sitemaps. Si le site web n'a que quelques pages, vous vous en sortirez très bien même sans en avoir.

Néanmoins, si vous souhaitez créer votre sitemap XML, vous pouvez simplement utiliser un plugin compatible avec votre système CMS. Quelques bons exemples pour WP sont :

  • Rank Math Sitemap Plugin- WP Sitemap Plugin- Google XML Sitemaps- WordPress SEO by Yoast

Alternativement, vous pouvez créer un sitemap manuellement ou utiliser un crawler pour parcourir votre site web et exporter un sitemap à télécharger.

Pour résumer :

J'espère que ces conseils vous ont aidé à plonger plus profondément dans le monde des Sitemaps et que vous êtes maintenant plus familier avec leur fonctionnement, pourquoi nous en avons besoin… et bien sûr comment les trouver.

Faites-nous savoir dans les commentaires s'il y a autre chose que vous aimeriez savoir ou simplement pour partager votre expérience :)

Bonne chance !

Auteur : Ognian Mikov

Ognian Mikov

Le SEO est entré dans ma vie en 2012, et depuis, c'est une véritable histoire d'amour. Pour moi, c'est bien plus qu'un simple métier : c'est à la fois une passion et un loisir qui me donne envie de continuer à apprendre et à progresser. Que je sois en train d'explorer de nouveaux sujets, de créer du contenu ou de plonger dans des optimisations techniques, je reste fasciné par l'immensité du marketing digital et par toutes les opportunités qu'il offre pour booster les performances d'un site web.

En 2021, j'ai rejoint SEO Alive et SEOcrawl — ma toute première entreprise en télétravail — où j'ai pu développer de nouvelles compétences et travailler sur des projets passionnants. Plus important encore, j'ai eu la chance de rencontrer des collègues formidables et d'apprendre à leurs côtés ; beaucoup sont aussi devenus des amis.

Je suis titulaire d'une licence en Marketing et d'un master en Relations Publiques et Publicité. Pendant mon temps libre, j'aime passer du temps avec ma fille, jouer et regarder des parties d'échecs, de football (Само Левски & Més que un club) et de poker.

→ Lire tous les articles de Ognian
Plus d'articles de Ognian Mikov

Découvrez plus de contenu de cet auteur