Hoe vind je de sitemap van een website

De sitemap van een willekeurige website vinden is relatief eenvoudig te doen en hier helpen we je bij deze missie. We beginnen met het meest voorkomende sitemap-formaat, namelijk XML, en behandelen daarna enkele andere. Maar eerst beginnen we bij de basis.
Wat is een sitemap?
Een XML-sitemap is een lijst van de pagina's op een website, bedoeld om de verschillende zoekmachines te helpen. Het biedt belangrijke informatie over de URL's van je website, waaronder pagina's, video's, afbeeldingen, bestanden en hun onderlinge relatie. Naast de pagina's bevatten XML-sitemaps ook aanvullende metadata over elke URL:
- laatst bijgewerkte datum- hoe vaak het verandert en - de prioriteit ten opzichte van de andere pagina's.
Als het aankomt op SEO best practices moet een sitemap geoptimaliseerd zijn om alleen indexeerbare en kwalitatieve content te bevatten. Elke kapotte (404), redirectende of dubbele pagina erin kan zoekmachines in verwarring brengen.
De sitemap is als een overzicht van een website. Deze is opgebouwd in code-formaat en ziet er meestal zo uit:

Of zo:

Waarom moet je een sitemap vinden?
We hebben de basis van sitemaps al besproken, inclusief hun belangrijkste doel. Laten we nu kijken waarom we deze bestanden überhaupt zouden willen vinden.
Zoals we hierboven hebben besproken, zijn sitemaps een onvervangbare en eenvoudige manier om zoekmachines en in het bijzonder hun crawlers (bijv. Googlebot) te informeren over de belangrijke content op onze website.
Allereerst wil je misschien controleren of je überhaupt een XML-sitemap hebt. Als je er een hebt, is de volgende stap om deze te inspecteren en te kijken of deze correct is opgesteld en de juiste informatie bevat.
Ten slotte, als je geen sitemap hebt, wil je er misschien een maken en indienen bij zoekmachines. Houd er rekening mee dat XML-sitemaps op geen enkele manier verplicht zijn. Toch helpen ze zoekcrawlers om nieuwe websites en pagina's sneller te vinden, indexeren en uiteindelijk te ranken.
Nu is het tijd om diep in het detectivewerk te duiken en die sitemaps te vinden!
Klaar? Daar gaan we!
Eenvoudige manieren om je sitemap te vinden
Laten we onze reis beginnen met enkele van de makkelijkste manieren om de sitemap van een website te vinden.
1) Controleer handmatig de gebruikelijke XML-sitemap-locaties
Een van de meest voorkomende (en eenvoudige) manieren om de XML-sitemap van een website te lokaliseren is om handmatig een paar standaardlocaties te controleren. Dit is doodsimpel en het enige wat je hoeft te doen is je website-URL in de browser invoeren en vervolgens een paar verschillende varianten proberen. Laat me je laten zien:
Dit is de populairste locatie, maar niet de enige. Dus als we geen geluk hebben bij onze eerste poging, zijn hier nog een paar snelle controles om te proberen:
- /sitemap_index.xml (wat de index is van alle sitemaps voor het geval een website er meer dan één heeft).
Dit is het geval met onze eigen XML- sitemap op deze blog. Laat me je laten zien:

En zo ziet het eruit:

In feite zijn dit allemaal aparte sitemap-sitemaps die zijn onderverdeeld op basis van het type berichten dat ze bevatten.
Als we nog steeds pech hebben, laten we dan nog wat opties proberen:
- /sitemap-index.xml- /sitemap.php- /sitemap.txt- /sitemap.xml.gz- /sitemap/- /sitemap/sitemap.xml- /sitemapindex.xml- /sitemap/index.xml- /sitemap1.xml
Opmerking: XML-bestanden zijn slechts één van de manieren om een sitemap te beschrijven. Er zijn ook RSS- en Atom-formaten.
Daarom moeten we nog een paar mogelijke sitemap-locaties toevoegen:
- /rss/- /rss.xml- /atom.xml
We gaan het er later meer over hebben.
Even ter bevestiging: we moeten de domeinnaam van de website vóór de "/" zetten bij het proberen van de verschillende alternatieven.
2) Controleer het robots.txt-bestand
Als je nog steeds bij ons bent, betekent dat dat je ofwel het bestand dat het hoofddoel van ons artikel is niet hebt kunnen vinden, ofwel gewoon nieuwsgierig en gepassioneerd bent om meer te leren.
Wat de exacte reden ook is, ik heb goed nieuws voor je - we zetten onze reis voort met nog een heel eenvoudige tip.
Robots.txt is een speciaal bestand dat SEO's (en programmeurs) kennen en dat nuttige richtlijnen biedt aan crawlers van zoekmachines. Bovendien is dit ook de plek waar je heel vaak een link naar de sitemap van een website kunt vinden.
Het idee is dat omdat zoekmachines deze robots.txt-bestanden bezoeken, het toevoegen van een link naar de sitemap daar volkomen logisch is. Op die manier wordt het voor hen makkelijker om de sitemap in de eerste plaats te detecteren en de website te crawlen.
Ben je klaar voor nog meer goed nieuws?! Hier komt het: om toegang te krijgen tot het robots.txt-bestand van een website hoef je alleen maar /robots.txt toe te voegen aan je domeinnaam in de browser en op "Enter" te drukken. Dit is vergelijkbaar met de vorige stap waarin we de verschillende mogelijke sitemap-routes toevoegden.
Wat werkt beter dan een praktijkvoorbeeld? Bekijk het URL-adres van ons eigen robots.txt-bestand:
https://seocrawl.com/robots.txt
Het is een klein maar eenvoudig en nuttig bestand met enkele belangrijke functies. Mocht je het al hebben geopend, dan kun je vrijwel direct het kleine juweeltje zien waar je naar op zoek bent: het sitemap-bestand:

Voilà! Ik had je beloofd dat het makkelijk zou zijn :)
3) Controleer Google Search Console
Oké, sitemap nog steeds niet gevonden? Geen probleem! We hebben meer tips voor je die ons zullen helpen onze weg te vinden.
Laat me je nog een eenvoudige en snelle manier laten zien.
Google Search Console (in het verleden ook bekend als Webmaster Tools) is nog een plek om het pad te vinden waar we naar op zoek zijn. Om dit mogelijk te maken moet je natuurlijk wel eigenaar van de website zijn of toegang hebben gekregen.
Als je aan een van deze criteria voldoet, is de volgende stap om in te loggen op GSC en in het menu aan de linkerkant Sitemaps te kiezen:

Als de sitemap (of sitemaps) in het verleden al door iemand anders is ingediend, kun je deze meteen zien:

Naast het exacte URL-adres van de sitemap is er aanvullende informatie zoals het type sitemap (indexbestanden die andere sitemaps bevatten of reguliere sitemaps met de pagina's van de website), wanneer het is ingediend, wanneer het voor het laatst is gelezen, de status en hoeveel URL's erin zitten.
TIP: Als je serieus bezig bent met SEO en het verbeteren van de organische prestaties van je website, is Google Search Console een onmisbare tool. De inzichten die je eruit kunt halen zijn talrijk.
Plus, een extra bonus is dat het hebben van GSC je de mogelijkheid biedt om onze krachtige tool - SEOcrawl - te proberen
4) Controleer Bing Webmaster Tools
Het goede nieuws is dat Bing Webmaster Tools vrijwel op dezelfde manier werkt als Google Search Console. Het is niet verrassend dat die laatste vroeger Google Webmaster Tools heette, aangezien ze veel gemeen hebben.
Ook hier moet je inloggen en vervolgens naar de linkerzijbalk navigeren, waar je de sectie "Sitemaps" beschikbaar hebt.

Klik erop, en als er al een sitemap/sitemaps was ingediend, kun je deze verder verkennen.

Geavanceerde manieren om je sitemap te vinden
Nog steeds bij ons? Oké, dan betekent dat dat je nog steeds op zoek bent naar die kostbare sitemap-bestandslocatie, of dat je heel dapper bent om de geavanceerde sectie te betreden. In beide gevallen wil ik je feliciteren dat je zo ver bent gekomen en je succes wensen :)
Ik beloof je dat het niet zo ingewikkeld en eng wordt! Daar gaan we!
5) Gebruik Google-zoekoperators
Google-zoekoperators (ook bekend als commando's) kunnen zeer krachtig zijn voor verschillende SEO-doelen (bijv. het vinden van linkbuilding-kansen, content-ideeën, het ontdekken van technische problemen, en meer). In dit geval zullen we ze echter gebruiken om de XML-sitemap te vinden van de website die we onderzoeken.
Daarvoor moeten we gebruikmaken van het "filetype:"-commando. Het kan erg nuttig zijn wanneer we het combineren met het "site:"-commando. In principe zoekt de combinatie van beide naar specifieke bestandstypen alleen in de website die we willen.
Voorbeeld: site:chess.com filetype:xml
En dit is wat deze zoekopdracht oplevert in Google:

Daar hebben we het! Alle geïndexeerde sitemaps van de website worden in Google getoond en we kunnen ze verder verkennen.
Als er irrelevante resultaten worden getoond, kun je je zoekopdracht nog verder verfijnen. Deze keer voegen we de "inurl"-operator toe aan ons arsenaal.
Bijvoorbeeld: site:uefa.com filetype:xml inurl:sitemap

Opmerking: zoals we hierboven vermeldden, kunnen sitemaps ook tekstbestanden zijn. Om ze te vinden kunnen we een vergelijkbare zoekopdracht uitvoeren, maar met een andere extensie.
Bijvoorbeeld: site:WebsiteURL inurl:sitemap filetype:txt
En dit levert het volgende op:

TIP: Deze commando's onthullen de locatie van de sitemap alleen als deze is geïndexeerd door Google. Sommige WP-plugins die sitemaps maken voegen automatisch de tag no follow, no index toe aan Sitemaps. Dus als je geen resultaten vindt, maak je geen zorgen!
Laten we verder gaan met het volgende idee.

6) Gebruik een online tool
Een andere techniek is om het te proberen met een online tool zoals SEO Site Checkup, waar je alleen je website-URL hoeft te plakken en op Checkup te klikken. Vervolgens krijg je zoiets als dit:Opmerking: De manier waarop deze tool werkt is door de standaard sitemap-locaties te controleren die we eerder noemden (sitemap.xml, sitemap1.xml, sitemapindex.xml enzovoort). Daarom kan het zijn dat je website in andere specifieke gevallen niet wordt gevonden.
7) Controleer het CMS van de website
Afhankelijk van het content management systeem waarop de site draait, kunnen XML-sitemaps op verschillende plaatsen zijn te vinden. Het goede nieuws is dat de populairste CMS'en standaardlocaties hebben waar je je zoektocht kunt beginnen.
Eerst moeten we het CMS identificeren van de website. Het is een vrij eenvoudig proces en we kunnen zowel online tools als browser-extensies gebruiken.
Een nuttige addon is bijvoorbeeld Built With, die niet alleen het CMS identificeert, maar ook veel meer software en programma's die de website gebruikt. Zo toont het de informatie die je zoekt:

Als je de voorkeur geeft aan een online tool, is WhatCMS een mogelijke oplossing:

Een alternatief is CMS Detect:

Nu we het exacte CMS kennen, laten we enkele van de populairste content management systemen verkennen en waar ze meestal de XML-bestanden bewaren.
Wordpress
Voor 2020 werden sitemaps voornamelijk via plugins gemaakt. Tegenwoordig echter, met de ingebouwde WP-functionaliteit, zouden ze zich moeten bevinden op /wp-sitemap.xml.
Toch kun je, als de website die je onderzoekt een plugin gebruikt voor het maken van de sitemap, enkele van de volgende locaties proberen:
- /sitemap.xml- /tag-sitemap.xml- /sitemap_index/xml- /category-sitemap.xml
Als alternatief kun je de instellingen van de plugin controleren en daar het pad vinden.
Wix, Shopify, Joomla, Squarespace, Magento
Het goede nieuws is dat deze allemaal automatisch de XML-sitemaps voor hun gebruikers genereren. Daarom is de standaardlocatie (indien niet aanvullend gewijzigd): /sitemap.xml
Met de opmerking dat de domeinnaam vóór het "/"-gedeelte komt.
BONUS: Een bookmarklet voor directe Sitemap.xml-detectie
Als je een fan bent van productiviteit en tijdbesparing bij elke kleine taak (zijn we SEO's niet allemaal zo?!), dan vind je misschien een nuttige snelle bookmarklet om direct de XML-sitemap van een website te controleren.
Je hoeft alleen deze javascript-code toe te voegen:
javascript:void(location.href='http://' + location.host + '/sitemap.xml')
Maak er een bladwijzer van en elke keer dat je erop klikt, wordt het Sitemap-bestand geopend, mits het zich op de standaardlocatie /sitemap.xml bevindt.
Snel en eenvoudig!
Andere soorten sitemaps vinden
We hadden het voornamelijk over XML-sitemaps omdat dit het meest voorkomende formaat is om crawlers te laten zien wat er op je domein gebeurt. Toch is het de moeite waard om de andere typen te vermelden die ook op sommige websites te vinden zijn.
- HTML. Deze worden meestal gemaakt om het de gebruikers makkelijker te maken en ze zijn erg handig, vooral voor grotere websites.
Ebay bijvoorbeeld biedt zijn bezoekers een virtuele "kaart" met de belangrijkste pagina's en categorieën: https://pages.ebay.com/sitemap.html

-
RSS. In sommige gevallen gebruiken websites een RSS-feed als sitemap die zich meestal bevindt op: /rss/ of /rss.xml.
-
Atom. Hetzelfde geldt voor de Atom-feed en je kunt deze meestal vinden als: /atom.xml- TXT. Dit is een standaard tekstbestand zoals we al een dergelijk voorbeeld hebben besproken. Locatie: /sitemap.txt
Geen sitemap? Wat doe je in dit geval?
Na de verschillende opties voor het vinden van een sitemap te hebben doorgenomen, is het goed om een paar woorden te zeggen over wat te doen als er nog geen sitemap is aangemaakt. Dit zal het geval zijn bij de meeste gloednieuwe websites die nog maar kort online zijn. Of bij sommige heel kleine en minuscule sites.
Houd er ook rekening mee dat niet alle websites sitemaps nodig hebben. Als de website maar een paar pagina's heeft, red je het prima zonder.
Toch, als je bereid bent om je XML-sitemap te maken, kun je gewoon een plugin gebruiken die compatibel is met je CMS-systeem. Een paar goede voorbeelden voor WP zijn:
- Rank Math Sitemap Plugin- WP Sitemap Plugin- Google XML Sitemaps- WordPress SEO by Yoast
Als alternatief kun je handmatig een sitemap maken of een crawler gebruiken om je website door te nemen en een sitemap te exporteren voor upload.
Samenvattend:
Ik hoop dat deze tips je hebben geholpen om dieper in de wereld van sitemaps te duiken en dat je nu meer vertrouwd bent met hoe ze werken, waarom we ze nodig hebben... en natuurlijk hoe je ze kunt vinden.
Laat het ons weten in de reacties als er nog iets anders is wat je zou willen weten of gewoon om je ervaring te delen :)
Veel succes!
Auteur: Ognian Mikov

SEO kwam in 2012 mijn leven binnen en sindsdien ben ik er helemaal verliefd op. Voor mij is het veel meer dan alleen een baan — het is tegelijk een passie en een hobby die me blijft motiveren om te leren en te groeien. Of ik nu nieuwe onderwerpen onderzoek, content creëer of me verdiep in technische optimalisaties: de enorme wereld van digital marketing blijft me fascineren, net als alle mogelijkheden om de prestaties van een website te verbeteren.
In 2021 ben ik begonnen bij SEO Alive en SEOcrawl — mijn eerste remote bedrijf — waar ik nieuwe vaardigheden heb kunnen ontwikkelen en aan boeiende projecten heb mogen werken. Maar belangrijker nog: ik heb de kans gehad om geweldige collega's te leren kennen en van hen te leren, van wie er inmiddels ook veel vrienden zijn geworden.
Ik heb een bachelor in Marketing en een master in PR & Reclame. In mijn vrije tijd breng ik graag tijd door met mijn dochter en speel en kijk ik graag schaak, voetbal (Само Левски & Més que un club) en poker.
Ontdek meer content van deze auteur
