Com trobar el sitemap d'un lloc web

Trobar el sitemap de qualsevol lloc web és relativament fàcil de fer i aquí t'ajudarem a aconseguir aquesta missió. Començarem amb el format de sitemap més comú, que és XML, i després cobrirem alguns altres. Primer, comencem amb els fonaments.
Què és un sitemap?
Un sitemap XML és una llista de les pàgines d'un lloc web destinada a ajudar els diferents cercadors. Proporciona informació important sobre les URLs del teu lloc web incloent-hi pàgines, vídeos, imatges, fitxers i quina és la seva relació. Juntament amb les pàgines, els sitemaps XML també inclouen metadades addicionals sobre cada URL:
- data de l'última actualització- amb quina freqüència canvia i - la seva prioritat en comparació amb les altres pàgines.
Pel que fa a les bones pràctiques de SEO, un sitemap s'hauria d'optimitzar per incloure només contingut indexable i de qualitat. Qualsevol pàgina trencada (404), redirigida o duplicada dins seu podria confondre els cercadors.
El sitemap és com un esquema d'un lloc web. Es construeix en format de codi i normalment té aquest aspecte:

O com aquest:

Per què necessites trobar un sitemap?
Ja hem cobert els fonaments dels sitemaps, incloent-hi el seu propòsit principal. Vegem ara per què podem voler trobar aquests fitxers en primer lloc.
Com hem comentat més amunt, els sitemaps són una manera insubstituïble i senzilla d'informar els cercadors i, en particular, els seus crawlers (p. ex. Googlebot) sobre el contingut important del nostre lloc web.
Primer de tot, pots voler comprovar si tens un sitemap XML. Si en tens un, el pas següent és inspeccionar-lo i veure si està creat correctament i conté la informació adequada.
Finalment, si no tens un sitemap, pots voler crear-ne un i enviar-lo als cercadors. Tingues en compte que els sitemaps XML no són obligatoris en absolut. Tot i així, ajuden els crawlers a trobar, indexar i, en última instància, posicionar nous llocs web i pàgines de manera més ràpida.
Ara és el moment de submergir-nos en la feina detectivesca i trobar aquests sitemaps!
Preparat? Som-hi!
Maneres senzilles de trobar el teu sitemap
Comencem el nostre viatge amb algunes de les maneres més fàcils de trobar el sitemap d'un lloc web.
1) Comprova manualment les ubicacions habituals del sitemap XML
Una de les maneres més comunes (i senzilles) de localitzar el sitemap XML d'un lloc web és comprovar manualment unes quantes ubicacions estàndard. Això és súper senzill i només has d'introduir l'URL del teu lloc web al navegador i provar amb diverses variacions. Et mostro:
Aquesta és la ubicació més popular, però no l'única. Per tant, si no tenim sort amb el primer intent, aquí tens algunes comprovacions ràpides més per provar:
- /sitemap_index.xml (que és l'índex de tots els sitemaps en cas que un lloc web en tingui més d'un).
Aquest és el cas amb el nostre propi sitemap XML en aquest blog. Et mostro:

I així és com es veu:

Bàsicament, aquests són tots sitemaps separats dividits pel tipus de posts que tenen dins.
Ara, si encara tenim mala sort, provem unes quantes opcions més:
- /sitemap-index.xml- /sitemap.php- /sitemap.txt- /sitemap.xml.gz- /sitemap/- /sitemap/sitemap.xml- /sitemapindex.xml- /sitemap/index.xml- /sitemap1.xml
Nota: els fitxers XML són només una de les maneres de descriure un sitemap. També hi ha els formats RSS i Atom.
Per tant, hem d'afegir algunes ubicacions de sitemap possibles més:
- /rss/- /rss.xml- /atom.xml
En parlarem més endavant.
Només per confirmar: hem de posar el nom de domini dels llocs web abans de la "/" mentre provem les diverses alternatives.
2) Comprova el fitxer Robots.txt
Si encara estàs amb nosaltres, això vol dir que o bé no has aconseguit trobar el fitxer, que és el propòsit principal del nostre article, o simplement tens curiositat i ganes d'aprendre més.
En realitat, sigui quina sigui la raó exacta, tinc bones notícies per a tu: continuarem el nostre viatge amb un altre consell molt senzill.
El Robots.txt és un fitxer especial conegut pels SEOs (i també pels programadors) que proporciona directives útils als crawlers dels cercadors. A més, aquest també és el lloc on molt sovint pots trobar un enllaç al sitemap d'un lloc web.
La idea és que, com que els cercadors visiten aquests fitxers robots.txt, afegir-hi un enllaç al sitemap té tot el sentit. D'aquesta manera, els serà més fàcil detectar el sitemap en primer lloc i rastrejar el lloc web.
Estàs preparat per a una altra bona notícia?! Aquí va: per accedir al fitxer robots.txt d'un lloc web només has d'afegir /robots.txt al teu nom de domini al navegador i prémer "Enter". Això és similar al pas anterior on afegíem les diferents rutes possibles del sitemap.
Què funciona millor que un exemple de la vida real? Mira l'adreça URL del nostre propi fitxer robots.txt:
https://seocrawl.com/robots.txt
És un fitxer petit però senzill i útil amb algunes funcions importants. En cas que ja l'hagis obert, podràs veure gairebé instantàniament la petita joia que estàs cercant: el fitxer del sitemap:

Voilà! T'havia promès que seria fàcil :)
3) Comprova Google Search Console
D'acord, encara no s'ha trobat el sitemap? Cap problema! Tenim més consells per a tu que ens ajudaran a trobar el camí.
Et mostro una altra manera fàcil i ràpida.
Google Search Console (també conegut com a Webmaster Tools en el passat) és un altre lloc per trobar el camí que estem cercant. Per descomptat, perquè això sigui possible, has de ser propietari del lloc web o haver rebut accés.
Si compleixes algun d'aquests criteris, el pas següent és iniciar sessió a GSC i, des del menú de l'esquerra, triar Sitemaps:

Ara, en cas que el sitemap (o sitemaps) ja hagi estat enviat per algú al passat, podràs veure'l de seguida:

Juntament amb l'adreça URL exacta del sitemap, hi ha informació addicional com el tipus de sitemap (fitxers d'índex que contenen altres sitemaps o sitemaps regulars amb les pàgines del lloc web), quan es va enviar, l'última lectura, l'estat i quantes URLs hi ha dins.
CONSELL: Si et prens seriosament el SEO i la millora del rendiment orgànic del teu lloc web, Google Search Console és una eina imprescindible. Els insights que en pots obtenir són nombrosos.
A més, un bonus afegit és que tenir GSC et permet provar la nostra potent eina: SEOcrawl
4) Comprova Bing Webmaster Tools
La bona notícia és que Bing Webmaster Tools funciona pràcticament igual que Google Search Console. No és sorprenent que aquest últim abans s'anomenés Google Webmaster Tools, ja que tenen molt en comú.
De nou, has d'iniciar sessió i navegar a la barra lateral esquerra, on tindràs disponible la secció "Sitemaps".

Fes-hi clic, i en cas que ja hi hagi un sitemap/sitemaps enviats, els podràs explorar més a fons.

Maneres avançades de trobar el teu sitemap
Encara amb nosaltres? D'acord, això vol dir que o bé encara estàs cercant aquesta preuada ubicació del fitxer sitemap, o ets molt valent per entrar a la secció avançada. En tots dos casos, vull felicitar-te per haver arribat tan lluny i desitjar-te sort :)
Et prometo que no serà tan complicat ni espantós! Som-hi!
5) Utilitza els operadors de cerca de Google
Els operadors de cerca de Google (també coneguts com a commands) poden ser molt potents per a diversos objectius SEO (p. ex. trobar oportunitats de link building, idees de contingut, descobrir problemes tècnics, i més). No obstant això, en aquest cas els utilitzarem per trobar el sitemap XML del lloc web que estem examinant.
Per a això, haurem d'aprofitar la comanda "filetype:". Pot ser realment útil quan la combinem amb la comanda "site:". Bàsicament, la combinació de totes dues buscarà tipus de fitxer específics només al lloc web que vulguem.
Exemple: site:chess.com filetype:xml
I aquí està el que aquesta cerca portarà a Google:

Aquí ho tenim! Tots els sitemaps indexats del lloc web es mostren a Google i els podem explorar més a fons.
En cas que es mostrin alguns resultats irrellevants, pots refinar la teva cerca encara més. Aquesta vegada afegirem l'operador "inurl" al nostre arsenal.
Per exemple: site:uefa.com filetype:xml inurl:sitemap

Nota: com hem comentat anteriorment, els sitemaps també poden ser fitxers de text. Per trobar-los, podem fer una cerca similar però amb una extensió diferent.
Per exemple: site:URLWeb inurl:sitemap filetype:txt
I això resultarà en el següent:

CONSELL: Aquestes comandes revelaran la ubicació del sitemap només si està indexat per Google. Alguns plugins de WP que creen sitemaps automàticament afegeixen l'etiqueta no follow, no index als Sitemaps. Així doncs, si acabes sense resultats trobats, no t'amoïnis!
Continuem amb la següent idea.

6) Utilitza una eina online
Una altra tècnica és provar amb una eina online com SEO Site Checkup on només has d'enganxar l'URL del teu lloc web i prémer Checkup. Llavors obtindràs alguna cosa com això:Nota: La manera com funciona aquesta eina és comprovant les ubicacions estàndard del sitemap que hem esmentat anteriorment (sitemap.xml, sitemap1.xml, sitemapindex.xml i així successivament). Per tant, pot ser que no trobi el teu lloc web en altres casos específics.
7) Comprova el CMS del lloc web
Depenent del sistema de gestió de continguts en què s'executa el lloc, els sitemaps XML poden estar ubicats en llocs diferents. La bona notícia és que els CMS més populars tenen ubicacions per defecte des d'on pots començar la teva cerca.
Primer, hem d'identificar el CMS del lloc web. És un procés força senzill i podem utilitzar tant eines online com extensions del navegador.
Per exemple, un addon útil és Built With que identifica no només el CMS sinó molts més programaris i programes que el lloc web utilitza. Així és com mostra la informació que estàs cercant:

Si prefereixes una eina online, una possible solució és WhatCMS:

Una alternativa és CMS Detect:

Ara, quan sapiguem el CMS exacte, explorem alguns dels sistemes de gestió de continguts més populars i on solen guardar els fitxers XML.
Wordpress
Abans del 2020, la manera com es creaven els sitemaps era principalment a través de plugins. No obstant això, avui dia, amb la funcionalitat integrada de WP, haurien d'estar ubicats a /wp-sitemap.xml.
Tot i això, en cas que el lloc web que estàs examinant utilitzi un plugin per a la creació del sitemap, pots provar amb algunes de les ubicacions següents:
- /sitemap.xml- /tag-sitemap.xml- /sitemap_index/xml- /category-sitemap.xml
Alternativament, pots comprovar la configuració del plugin i trobar-hi el camí.
Wix, Shopify, Joomla, Squarespace, Magento
La bona notícia és que tots aquests generen automàticament els sitemaps XML per als seus usuaris. Per tant, la ubicació per defecte (si no es modifica addicionalment) és: /sitemap.xml
Amb la nota que el nom de domini va abans de la part "/".
BONUS: Un bookmarklet per a la descoberta instantània de Sitemap.xml
En cas que siguis fan de la productivitat i d'estalviar temps de cada petita tasca (no ho som tots els SEOs?!), llavors et pot ser útil un bookmarklet ràpid per comprovar instantàniament el sitemap XML d'un lloc web.
Només has d'afegir aquest codi javascript:
javascript:void(location.href='http://' + location.host + '/sitemap.xml')
Marca'l com a favorit i cada vegada que hi facis clic obrirà el fitxer Sitemap en cas que estigui ubicat a la ubicació per defecte /sitemap.xml.
Ràpid i fàcil!
Trobar altres tipus de sitemaps
Hem parlat principalment dels sitemaps XML, ja que són el format més comú per mostrar als crawlers què està passant al teu domini. Tot i així, val la pena esmentar els altres tipus que també es poden trobar en alguns llocs web.
- HTML. Aquests normalment es fan per facilitar les coses als usuaris i són molt útils especialment per a llocs web més grans.
Per exemple, Ebay proporciona als seus visitants un "mapa" virtual amb les pàgines i categories principals: https://pages.ebay.com/sitemap.html

-
RSS. En alguns casos els llocs web utilitzen un feed RSS com a sitemap, que normalment es troba a: /rss/ o /rss.xml.
-
Atom. El mateix s'aplica al feed Atom i normalment el pots trobar com a: /atom.xml- TXT. Aquest és un fitxer de text estàndard com ja hem comentat un exemple. Ubicació: /sitemap.txt
Sense sitemap? Què fer en aquest cas?
Després de revisar les diferents opcions per trobar un sitemap, és bo dir unes paraules sobre què fer si no hi ha cap sitemap ja creat. Aquest serà el cas amb la majoria de llocs web nous que han estat online durant un curt període. O alguns llocs molt petits.
A més, tingues en compte que no tots els llocs web necessiten sitemaps. Si el lloc web només té unes quantes pàgines, t'anirà bé fins i tot sense un.
Tot i així, si estàs disposat a crear el teu sitemap XML, simplement pots utilitzar un plugin compatible amb el teu sistema CMS. Alguns bons exemples per a WP són:
- Rank Math Sitemap Plugin- WP Sitemap Plugin- Google XML Sitemaps- WordPress SEO by Yoast
Alternativament, pots crear un sitemap manualment o utilitzar un crawler per recórrer el teu lloc web i exportar un sitemap per pujar-lo.
Per resumir:
Espero que aquests consells t'hagin ajudat a submergir-te més profundament al món dels Sitemaps i que ara estiguis més familiaritzat amb com funcionen, per què els necessitem... i, per descomptat, com trobar-los.
Fes-nos saber als comentaris si hi ha alguna cosa més que voldries saber o simplement comparteix la teva experiència :)
Sort!
Автор: Ognian Mikov

SEO увійшло в моє життя у 2012 році, і відтоді я живу ним з повною увагою. SEO для мене — це більше, ніж просто робота — це пристрасть і хобі, які постійно мотивують мене вчитися й розвиватися. Чи досліджую я нову тему, чи створюю контент, чи занурююся в технічні виправлення — широкий світ digital-маркетингу та безмежні можливості покращити ефективність сайтів завжди мене захоплюють.
Маю бакалавра з маркетингу та магістра з PR і реклами. У вільний час люблю проводити час з донькою та грати або дивитися шахи й футбол (Само Левски та Més que un club) і покер.
Дізнайтесь більше контенту цього автора

