Com trobar el sitemap d'un lloc web

Com trobar el sitemap d'un lloc web
Ognian Mikov
Tutorials SEO
12 min read

Trobar el sitemap de qualsevol lloc web és relativament fàcil de fer i aquí t'ajudarem a aconseguir aquesta missió. Començarem amb el format de sitemap més comú, que és XML, i després cobrirem alguns altres. Primer, comencem amb els fonaments.

Què és un sitemap?

Un sitemap XML és una llista de les pàgines d'un lloc web destinada a ajudar els diferents cercadors. Proporciona informació important sobre les URLs del teu lloc web incloent-hi pàgines, vídeos, imatges, fitxers i quina és la seva relació. Juntament amb les pàgines, els sitemaps XML també inclouen metadades addicionals sobre cada URL:

  • data de l'última actualització- amb quina freqüència canvia i - la seva prioritat en comparació amb les altres pàgines.

Pel que fa a les bones pràctiques de SEO, un sitemap s'hauria d'optimitzar per incloure només contingut indexable i de qualitat. Qualsevol pàgina trencada (404), redirigida o duplicada dins seu podria confondre els cercadors.

El sitemap és com un esquema d'un lloc web. Es construeix en format de codi i normalment té aquest aspecte:

Sitemap de SEOcrawl
Sitemap de SEOcrawl

O com aquest:

Sitemap XML
Sitemap XML

Per què necessites trobar un sitemap?

Ja hem cobert els fonaments dels sitemaps, incloent-hi el seu propòsit principal. Vegem ara per què podem voler trobar aquests fitxers en primer lloc.

Com hem comentat més amunt, els sitemaps són una manera insubstituïble i senzilla d'informar els cercadors i, en particular, els seus crawlers (p. ex. Googlebot) sobre el contingut important del nostre lloc web.

Primer de tot, pots voler comprovar si tens un sitemap XML. Si en tens un, el pas següent és inspeccionar-lo i veure si està creat correctament i conté la informació adequada.

Finalment, si no tens un sitemap, pots voler crear-ne un i enviar-lo als cercadors. Tingues en compte que els sitemaps XML no són obligatoris en absolut. Tot i així, ajuden els crawlers a trobar, indexar i, en última instància, posicionar nous llocs web i pàgines de manera més ràpida.

Ara és el moment de submergir-nos en la feina detectivesca i trobar aquests sitemaps!

Preparat? Som-hi!

Maneres senzilles de trobar el teu sitemap

Comencem el nostre viatge amb algunes de les maneres més fàcils de trobar el sitemap d'un lloc web.

1) Comprova manualment les ubicacions habituals del sitemap XML

Una de les maneres més comunes (i senzilles) de localitzar el sitemap XML d'un lloc web és comprovar manualment unes quantes ubicacions estàndard. Això és súper senzill i només has d'introduir l'URL del teu lloc web al navegador i provar amb diverses variacions. Et mostro:

Aquesta és la ubicació més popular, però no l'única. Per tant, si no tenim sort amb el primer intent, aquí tens algunes comprovacions ràpides més per provar:

  • /sitemap_index.xml (que és l'índex de tots els sitemaps en cas que un lloc web en tingui més d'un).

Aquest és el cas amb el nostre propi sitemap XML en aquest blog. Et mostro:

URL del sitemap SEOcrawl
URL del sitemap SEOcrawl

I així és com es veu:

Llistat de sitemaps de SEOcrawl
Llistat de sitemaps de SEOcrawl

Bàsicament, aquests són tots sitemaps separats dividits pel tipus de posts que tenen dins.

Ara, si encara tenim mala sort, provem unes quantes opcions més:

  • /sitemap-index.xml- /sitemap.php- /sitemap.txt- /sitemap.xml.gz- /sitemap/- /sitemap/sitemap.xml- /sitemapindex.xml- /sitemap/index.xml- /sitemap1.xml

Nota: els fitxers XML són només una de les maneres de descriure un sitemap. També hi ha els formats RSS i Atom.

Per tant, hem d'afegir algunes ubicacions de sitemap possibles més:

  • /rss/- /rss.xml- /atom.xml

En parlarem més endavant.

Només per confirmar: hem de posar el nom de domini dels llocs web abans de la "/" mentre provem les diverses alternatives.

2) Comprova el fitxer Robots.txt

Si encara estàs amb nosaltres, això vol dir que o bé no has aconseguit trobar el fitxer, que és el propòsit principal del nostre article, o simplement tens curiositat i ganes d'aprendre més.

En realitat, sigui quina sigui la raó exacta, tinc bones notícies per a tu: continuarem el nostre viatge amb un altre consell molt senzill.

El Robots.txt és un fitxer especial conegut pels SEOs (i també pels programadors) que proporciona directives útils als crawlers dels cercadors. A més, aquest també és el lloc on molt sovint pots trobar un enllaç al sitemap d'un lloc web.

La idea és que, com que els cercadors visiten aquests fitxers robots.txt, afegir-hi un enllaç al sitemap té tot el sentit. D'aquesta manera, els serà més fàcil detectar el sitemap en primer lloc i rastrejar el lloc web.

Estàs preparat per a una altra bona notícia?! Aquí va: per accedir al fitxer robots.txt d'un lloc web només has d'afegir /robots.txt al teu nom de domini al navegador i prémer "Enter". Això és similar al pas anterior on afegíem les diferents rutes possibles del sitemap.

Què funciona millor que un exemple de la vida real? Mira l'adreça URL del nostre propi fitxer robots.txt:

https://seocrawl.com/robots.txt

És un fitxer petit però senzill i útil amb algunes funcions importants. En cas que ja l'hagis obert, podràs veure gairebé instantàniament la petita joia que estàs cercant: el fitxer del sitemap:

Robots seocrawl
Robots seocrawl

Voilà! T'havia promès que seria fàcil :)

3) Comprova Google Search Console

D'acord, encara no s'ha trobat el sitemap? Cap problema! Tenim més consells per a tu que ens ajudaran a trobar el camí.

Et mostro una altra manera fàcil i ràpida.

Google Search Console (també conegut com a Webmaster Tools en el passat) és un altre lloc per trobar el camí que estem cercant. Per descomptat, perquè això sigui possible, has de ser propietari del lloc web o haver rebut accés.

Si compleixes algun d'aquests criteris, el pas següent és iniciar sessió a GSC i, des del menú de l'esquerra, triar Sitemaps:

Sitemaps a Google Search Console
Sitemaps a Google Search Console

Ara, en cas que el sitemap (o sitemaps) ja hagi estat enviat per algú al passat, podràs veure'l de seguida:

Sitemaps enviats
Sitemaps enviats

Juntament amb l'adreça URL exacta del sitemap, hi ha informació addicional com el tipus de sitemap (fitxers d'índex que contenen altres sitemaps o sitemaps regulars amb les pàgines del lloc web), quan es va enviar, l'última lectura, l'estat i quantes URLs hi ha dins.

CONSELL: Si et prens seriosament el SEO i la millora del rendiment orgànic del teu lloc web, Google Search Console és una eina imprescindible. Els insights que en pots obtenir són nombrosos.

A més, un bonus afegit és que tenir GSC et permet provar la nostra potent eina: SEOcrawl

4) Comprova Bing Webmaster Tools

La bona notícia és que Bing Webmaster Tools funciona pràcticament igual que Google Search Console. No és sorprenent que aquest últim abans s'anomenés Google Webmaster Tools, ja que tenen molt en comú.

De nou, has d'iniciar sessió i navegar a la barra lateral esquerra, on tindràs disponible la secció "Sitemaps".

Sitemaps a Bing Webmaster Tools
Sitemaps a Bing Webmaster Tools

Fes-hi clic, i en cas que ja hi hagi un sitemap/sitemaps enviats, els podràs explorar més a fons.

Sitemaps enviats a Bing Webmaster Tools
Sitemaps enviats a Bing Webmaster Tools

Maneres avançades de trobar el teu sitemap

Encara amb nosaltres? D'acord, això vol dir que o bé encara estàs cercant aquesta preuada ubicació del fitxer sitemap, o ets molt valent per entrar a la secció avançada. En tots dos casos, vull felicitar-te per haver arribat tan lluny i desitjar-te sort :)

Et prometo que no serà tan complicat ni espantós! Som-hi!

5) Utilitza els operadors de cerca de Google

Els operadors de cerca de Google (també coneguts com a commands) poden ser molt potents per a diversos objectius SEO (p. ex. trobar oportunitats de link building, idees de contingut, descobrir problemes tècnics, i més). No obstant això, en aquest cas els utilitzarem per trobar el sitemap XML del lloc web que estem examinant.

Per a això, haurem d'aprofitar la comanda "filetype:". Pot ser realment útil quan la combinem amb la comanda "site:". Bàsicament, la combinació de totes dues buscarà tipus de fitxer específics només al lloc web que vulguem.

Exemple: site:chess.com filetype:xml

I aquí està el que aquesta cerca portarà a Google:

Utilitza els operadors de cerca de Google per trobar sitemaps
Utilitza els operadors de cerca de Google per trobar sitemaps

Aquí ho tenim! Tots els sitemaps indexats del lloc web es mostren a Google i els podem explorar més a fons.

En cas que es mostrin alguns resultats irrellevants, pots refinar la teva cerca encara més. Aquesta vegada afegirem l'operador "inurl" al nostre arsenal.

Per exemple: site:uefa.com filetype:xml inurl:sitemap

Operador inurl per trobar sitemaps
Operador inurl per trobar sitemaps

Nota: com hem comentat anteriorment, els sitemaps també poden ser fitxers de text. Per trobar-los, podem fer una cerca similar però amb una extensió diferent.

Per exemple: site:URLWeb inurl:sitemap filetype:txt

I això resultarà en el següent:

Operador filetype per trobar sitemaps
Operador filetype per trobar sitemaps

CONSELL: Aquestes comandes revelaran la ubicació del sitemap només si està indexat per Google. Alguns plugins de WP que creen sitemaps automàticament afegeixen l'etiqueta no follow, no index als Sitemaps. Així doncs, si acabes sense resultats trobats, no t'amoïnis!

Continuem amb la següent idea.

SEO Site checkup
SEO Site checkup

6) Utilitza una eina online

Una altra tècnica és provar amb una eina online com SEO Site Checkup on només has d'enganxar l'URL del teu lloc web i prémer Checkup. Llavors obtindràs alguna cosa com això:Nota: La manera com funciona aquesta eina és comprovant les ubicacions estàndard del sitemap que hem esmentat anteriorment (sitemap.xml, sitemap1.xml, sitemapindex.xml i així successivament). Per tant, pot ser que no trobi el teu lloc web en altres casos específics.

7) Comprova el CMS del lloc web

Depenent del sistema de gestió de continguts en què s'executa el lloc, els sitemaps XML poden estar ubicats en llocs diferents. La bona notícia és que els CMS més populars tenen ubicacions per defecte des d'on pots començar la teva cerca.

Primer, hem d'identificar el CMS del lloc web. És un procés força senzill i podem utilitzar tant eines online com extensions del navegador.

Per exemple, un addon útil és Built With que identifica no només el CMS sinó molts més programaris i programes que el lloc web utilitza. Així és com mostra la informació que estàs cercant:

Addon Built With per identificar el CMS
Addon Built With per identificar el CMS

Si prefereixes una eina online, una possible solució és WhatCMS:

What CMS per a SEOcrawl
What CMS per a SEOcrawl

Una alternativa és CMS Detect:

CMS detect SEOcrawl
CMS detect SEOcrawl

Ara, quan sapiguem el CMS exacte, explorem alguns dels sistemes de gestió de continguts més populars i on solen guardar els fitxers XML.

Wordpress

Abans del 2020, la manera com es creaven els sitemaps era principalment a través de plugins. No obstant això, avui dia, amb la funcionalitat integrada de WP, haurien d'estar ubicats a /wp-sitemap.xml.

Tot i això, en cas que el lloc web que estàs examinant utilitzi un plugin per a la creació del sitemap, pots provar amb algunes de les ubicacions següents:

  • /sitemap.xml- /tag-sitemap.xml- /sitemap_index/xml- /category-sitemap.xml

Alternativament, pots comprovar la configuració del plugin i trobar-hi el camí.

Wix, Shopify, Joomla, Squarespace, Magento

La bona notícia és que tots aquests generen automàticament els sitemaps XML per als seus usuaris. Per tant, la ubicació per defecte (si no es modifica addicionalment) és: /sitemap.xml

Amb la nota que el nom de domini va abans de la part "/".

BONUS: Un bookmarklet per a la descoberta instantània de Sitemap.xml

En cas que siguis fan de la productivitat i d'estalviar temps de cada petita tasca (no ho som tots els SEOs?!), llavors et pot ser útil un bookmarklet ràpid per comprovar instantàniament el sitemap XML d'un lloc web.

Només has d'afegir aquest codi javascript:

javascript:void(location.href='http://' + location.host + '/sitemap.xml')

Marca'l com a favorit i cada vegada que hi facis clic obrirà el fitxer Sitemap en cas que estigui ubicat a la ubicació per defecte /sitemap.xml.

Ràpid i fàcil!

Trobar altres tipus de sitemaps

Hem parlat principalment dels sitemaps XML, ja que són el format més comú per mostrar als crawlers què està passant al teu domini. Tot i així, val la pena esmentar els altres tipus que també es poden trobar en alguns llocs web.

  • HTML. Aquests normalment es fan per facilitar les coses als usuaris i són molt útils especialment per a llocs web més grans.

Per exemple, Ebay proporciona als seus visitants un "mapa" virtual amb les pàgines i categories principals: https://pages.ebay.com/sitemap.html

Sitemap HTML
Sitemap HTML

  • RSS. En alguns casos els llocs web utilitzen un feed RSS com a sitemap, que normalment es troba a: /rss/ o /rss.xml.

  • Atom. El mateix s'aplica al feed Atom i normalment el pots trobar com a: /atom.xml- TXT. Aquest és un fitxer de text estàndard com ja hem comentat un exemple. Ubicació: /sitemap.txt

Sense sitemap? Què fer en aquest cas?

Després de revisar les diferents opcions per trobar un sitemap, és bo dir unes paraules sobre què fer si no hi ha cap sitemap ja creat. Aquest serà el cas amb la majoria de llocs web nous que han estat online durant un curt període. O alguns llocs molt petits.

A més, tingues en compte que no tots els llocs web necessiten sitemaps. Si el lloc web només té unes quantes pàgines, t'anirà bé fins i tot sense un.

Tot i així, si estàs disposat a crear el teu sitemap XML, simplement pots utilitzar un plugin compatible amb el teu sistema CMS. Alguns bons exemples per a WP són:

  • Rank Math Sitemap Plugin- WP Sitemap Plugin- Google XML Sitemaps- WordPress SEO by Yoast

Alternativament, pots crear un sitemap manualment o utilitzar un crawler per recórrer el teu lloc web i exportar un sitemap per pujar-lo.

Per resumir:

Espero que aquests consells t'hagin ajudat a submergir-te més profundament al món dels Sitemaps i que ara estiguis més familiaritzat amb com funcionen, per què els necessitem... i, per descomptat, com trobar-los.

Fes-nos saber als comentaris si hi ha alguna cosa més que voldries saber o simplement comparteix la teva experiència :)

Sort!

Автор: Ognian Mikov

Ognian Mikov

SEO увійшло в моє життя у 2012 році, і відтоді я живу ним з повною увагою. SEO для мене — це більше, ніж просто робота — це пристрасть і хобі, які постійно мотивують мене вчитися й розвиватися. Чи досліджую я нову тему, чи створюю контент, чи занурююся в технічні виправлення — широкий світ digital-маркетингу та безмежні можливості покращити ефективність сайтів завжди мене захоплюють.

Маю бакалавра з маркетингу та магістра з PR і реклами. У вільний час люблю проводити час з донькою та грати або дивитися шахи й футбол (Само Левски та Més que un club) і покер.

→ Читайте всі статті від Ognian
Більше статей: Ognian Mikov

Дізнайтесь більше контенту цього автора