Qu'est-ce que la balise noindex et comment fonctionne-t-elle ?

La balise noindex est l'une des balises meta SEO les plus importantes. Si vous n'êtes toujours pas sûr de ce qu'elle est ou de comment elle fonctionne, vous avez de la chance — aujourd'hui nous allons vous expliquer ce qu'est la balise noindex et à quoi elle sert en SEO.
Plongeons dedans.
Qu'est-ce que la balise meta noindex ?
La balise meta noindex est une balise HTML placée dans la section head d'une page web pour indiquer aux moteurs de recherche que la page qu'ils explorent ne doit pas être indexée. En d'autres termes, la balise permet toujours l'exploration d'une page mais bloque son indexation.
Pourquoi est-ce important pour le SEO ?
Comme nous venons de le mentionner, cette balise meta vous permet de contrôler l'indexation, qui, comme vous le savez, est l'un des piliers du SEO.
Dans le monde du SEO, elle est principalement utilisée pour empêcher Google de « classer » des pages de thin content sur votre site, telles que :
- Pages avec contenu dupliqué
- Catégories minces ou pages avec très peu de contenu
- Résultats de recherche internes
- Filtres ou combinaisons de filtres
Avec cette directive, les bots peuvent toujours explorer et analyser chaque lien qu'ils trouvent sur ces pages, mais sans les indexer.
Comment ajouter noindex à une page ?
Bonne nouvelle pour tous ceux qui détestent manipuler du code :
<meta name="robots" content="noindex">
C'est tout ? Oui, c'est littéralement tout. Vous insérez simplement ce snippet dans la <head> de votre page et, la prochaine fois que Google la visitera, il se rendra compte que la page ne doit pas être indexée.
Au cas où vous ne voudriez pas nous croire sur parole, voici la documentation officielle de Google sur le sujet.
Il convient également de noter que cette balise meta peut cibler n'importe quel bot — utilisez simplement le nom du bot au lieu de l'attribut générique robots (comme dans l'exemple ci-dessus). Par exemple, si vous vouliez que la règle s'applique uniquement à Googlebot, vous écririez :
<meta name="googlebot" content="noindex">
Vous pouvez ajouter autant de balises meta noindex que vous voulez, tant qu'elles ne se contredisent pas.
« Mais je suis sur WordPress et je ne sais pas comment ajouter ce code… » Pas d'inquiétude, nous vous couvrons.
Comment définir une page en noindex dans WordPress ?
Dans WordPress, c'est presque encore plus simple. Ouvrez simplement la page que vous voulez mettre en noindex et activez la bascule depuis la section SEO.

Dans notre cas, nous utilisons Rank Math (l'un des meilleurs plugins SEO), donc dans la page vous iriez à Rank Math SEO > Advanced > No Index.
Si vous utilisez Yoast, qui est aussi l'un des plugins les plus populaires, dans la page vous iriez à Yoast SEO > Advanced (l'icône d'engrenage) > No (sur le menu déroulant « Allow search engines to show this Page in search results? »).
Vous pouvez également appliquer ces changements en masse depuis les paramètres SEO de chaque plugin. Pour Rank Math, allez à Rank Math > Titles & Meta > Content types (choisissez celui que vous voulez) > Post Meta Robots > Custom > Noindex.

Pour Yoast, allez à SEO > Search Appearance > Content types > Show (content type) in search results? > No.

Types de noindex
Au sein de la balise meta noindex, il existe différentes configurations que vous pouvez choisir selon ce que vous essayez d'accomplir.
noindex, follow
C'est l'une des configurations les plus courantes en SEO. Avec cette configuration, vous indiquez aux bots via noindex qu'ils ne doivent pas afficher cette page dans les résultats de recherche, et via follow qu'ils doivent toujours explorer chaque lien sur la page.
Le snippet pour l'implémenter est :
<meta name="robots" content="noindex, follow">
Rappel : si vous êtes sur WordPress, vous pouvez gérer cela facilement depuis les paramètres de la page ou les paramètres globaux du plugin.
noindex, nofollow
Cette configuration n'est pas aussi courante, mais elle est disponible. Ici, vous indiquez aux bots de ne pas indexer la page avec le noindex, et — c'est là qu'elle diffère de l'option précédente — avec le nofollow vous ordonnez au bot de ne pas non plus explorer les liens sur la page sur laquelle il se trouve.
Le snippet pour l'implémenter est :
<meta name="robots" content="noindex, nofollow">
Erreurs courantes
Pour conclure, passons en revue quelques-unes des erreurs typiques que les gens rencontrent avec la balise meta noindex pour que vous ne trébuchiez pas là où la plupart le font.
L'URL soumise contient une balise « noindex »
C'est une erreur très courante signalée dans Google Search Console.
Cela se produit lorsque les URL avec la balise meta noindex sont soumises à Google via le sitemap.
En d'autres termes, d'un côté vous envoyez une URL à Google dans le sitemap pour qu'elle soit indexée plus rapidement et, d'un autre côté, vous lui dites de ne pas indexer cette même URL. Cela ne tient pas vraiment debout, n'est-ce pas ?
Comment le corriger :
- Soit retirer ces URL du sitemap, soit
- Retirer la balise noindex de ces URL.
Le bon choix dépend de ce que vous voulez que ces pages fassent.
Environnements staging / pré-production
Avez-vous déjà refait votre site ? Il y a de fortes chances que vous ayez dû créer une « copie » de votre site web sur un autre domaine, ou même à l'intérieur du même (le classique domaine.com/new).
Mais que se passe-t-il si ce site est ouvert au public ? Ou que se passe-t-il si Google tombe dessus ?
Le résultat le plus probable est que Google commence à tout indexer, et en peu de temps vous aurez votre nouveau site indexé et dupliqué.
Comment corrigeons-nous cela ?
Facile. Notre première recommandation est de protéger votre environnement de test par mot de passe. Si vous ne voulez pas, vous pouvez toujours mettre le site en noindex et le bloquer via robots.txt. Cette combinaison est un bon filet de sécurité contre les désastres.
Conclusion
Comme vous pouvez le voir, la balise meta noindex a beaucoup à offrir.
Comme c'est une directive, Google la respectera et n'indexera pas la page, mais il l'explorera quand même. Pour cette raison, nous recommandons de l'utiliser pour les cas que nous avons couverts mais pas comme moyen d'économiser du crawl budget.
Si vous avez des questions, posez-les dans les commentaires :)
Auteur : David Kaufmann

Cela fait plus de 10 ans que je suis totalement obsédé par le SEO — et honnêtement, je ne voudrais pas qu'il en soit autrement.
Ma carrière a franchi un cap lorsque j'ai travaillé comme Senior SEO Specialist pour Chess.com — l'un des 100 sites les plus visités de tout Internet. Opérer à cette échelle, sur des millions de pages, des dizaines de langues et dans l'une des SERPs les plus concurrentielles qui soient, m'a appris des choses qu'aucun cours ni aucune certification ne pourrait jamais transmettre. Cette expérience a transformé ma vision de ce qu'est réellement un SEO d'excellence — et elle est devenue le socle de tout ce que j'ai construit depuis.
Forcé par cette expérience, j'ai fondé SEO Alive — une agence pour les marques qui prennent la croissance organique au sérieux. Nous ne sommes pas là pour vendre des dashboards et des rapports mensuels. Nous sommes là pour bâtir des stratégies qui font vraiment la différence, en combinant le meilleur du SEO classique avec le nouvel univers passionnant de la Generative Engine Optimization (GEO) — afin que votre marque apparaisse non seulement dans les liens bleus de Google, mais aussi dans les réponses générées par l'AI que ChatGPT, Perplexity et Google AI Overviews livrent chaque jour à des millions de personnes.
Et parce que je ne trouvais aucun outil capable de gérer correctement ces deux mondes, j'en ai construit un moi-même — SEOcrawl, une plateforme d'intelligence SEO pour les entreprises qui réunit rankings, audits techniques, monitoring des backlinks, santé du crawl et suivi de la visibilité de marque dans l'AI, le tout au même endroit. C'est la plateforme dont j'ai toujours rêvé.
Découvrez plus de contenu de cet auteur

