วิธีค้นหา Sitemap ของเว็บไซต์

วิธีค้นหา Sitemap ของเว็บไซต์
Ognian Mikov
บทเรียน SEO
5 min read

การค้นหา sitemap ของเว็บไซต์ใด ๆ ทำได้ค่อนข้างง่ายและที่นี่เราจะช่วยให้คุณบรรลุภารกิจนี้ เราจะเริ่มต้นด้วยรูปแบบ sitemap ที่พบบ่อยที่สุดคือ XML และจากนั้นครอบคลุมรูปแบบอื่น ๆ อีกสองสามรูปแบบ ก่อนอื่น มาเริ่มต้นด้วยพื้นฐาน

Sitemap คืออะไร?

XML sitemap คือ รายการของหน้า บนเว็บไซต์ที่มีจุดมุ่งหมายเพื่อช่วยเครื่องมือค้นหาต่าง ๆ ให้ข้อมูลสำคัญเกี่ยวกับ URL บนเว็บไซต์ของคุณ รวมถึงหน้า วิดีโอ ภาพ ไฟล์ และความสัมพันธ์ของพวกเขา พร้อมกับหน้า XML sitemaps ยังรวม เมตาดาต้าเพิ่มเติม เกี่ยวกับ URL แต่ละรายการ:

  • วันที่อัปเดตล่าสุด - ความถี่ในการเปลี่ยนแปลง และ - ความสำคัญของมันเทียบกับหน้าอื่น

เมื่อพูดถึง แนวทางปฏิบัติที่ดีที่สุดของ SEO sitemap ควรได้รับการเพิ่มประสิทธิภาพเพื่อรวมเฉพาะเนื้อหาที่จัดทำดัชนีและคุณภาพ หน้าที่เสีย (404), เปลี่ยนเส้นทาง หรือซ้ำกัน ภายในอาจทำให้เครื่องมือค้นหาสับสน

sitemap เหมือน โครงร่าง ของเว็บไซต์ สร้างในรูปแบบรหัสและมักจะมีลักษณะดังนี้:

SEOcrawl sitemap
SEOcrawl sitemap

หรือแบบนี้:

Sitemap XML
Sitemap XML

เหตุใดคุณต้องค้นหา Sitemap?

เราได้ครอบคลุมพื้นฐาน sitemaps แล้ว รวมถึงวัตถุประสงค์หลัก ตอนนี้มาดูว่าทำไมเราอาจต้องการค้นหาไฟล์เหล่านี้ในตอนแรก

ดังที่เราพูดคุยกันข้างต้น sitemaps เป็น วิธีที่ไม่สามารถทดแทนได้และง่าย ในการแจ้งเครื่องมือค้นหาและโดยเฉพาะ crawlers ของพวกเขา (เช่น Googlebot) เกี่ยวกับเนื้อหาที่สำคัญบนเว็บไซต์ของเรา

ก่อนอื่น คุณอาจต้องการตรวจสอบว่าคุณมี XML sitemap หรือไม่ หากคุณมี ขั้นตอนต่อไป คือตรวจสอบและดูว่าสร้างอย่างเหมาะสมและมีข้อมูลที่ถูกต้องหรือไม่

สุดท้าย หากคุณไม่มี sitemap คุณอาจต้องการสร้างและส่งให้เครื่องมือค้นหา โปรดทราบว่า XML sitemaps ไม่บังคับด้วยวิธีใด อย่างไรก็ตามช่วย search crawlers ค้นหา จัดทำดัชนี และในที่สุดจัดอันดับ เว็บไซต์และหน้าใหม่ในวิธีที่เร็วขึ้น

ตอนนี้ถึงเวลาที่จะดำดิ่งสู่งานนักสืบและค้นหา sitemaps เหล่านั้น!

พร้อมหรือยัง? ไปกัน!

วิธีง่าย ๆ ในการค้นหา Sitemap ของคุณ

มาเริ่มการเดินทางของเราด้วย วิธีที่ง่ายที่สุดบางอย่าง ในการค้นหา sitemap ของเว็บไซต์

1) ตรวจสอบตำแหน่ง XML Sitemap ทั่วไปด้วยตนเอง

หนึ่งในวิธีที่พบบ่อยที่สุด (และง่ายที่สุด) ในการค้นหา XML sitemap ของเว็บไซต์คือ ตรวจสอบตำแหน่งมาตรฐานบางอย่างด้วยตนเอง นี่ง่ายอย่างที่สุดและสิ่งที่คุณต้องทำคือป้อน URL เว็บไซต์ของคุณในเบราว์เซอร์และจากนั้นลองด้วยการเปลี่ยนแปลงสองสามอย่าง ให้ฉันแสดงให้ดู:

นี่คือตำแหน่งที่นิยมมากที่สุด แต่ไม่ใช่ตำแหน่งเดียว ดังนั้น หากเราโชคไม่ดีกับความพยายามครั้งแรก นี่คือการตรวจสอบด่วนเพิ่มเติมที่จะลอง:

  • /sitemap_index.xml (ซึ่งเป็นดัชนีของ sitemaps ทั้งหมดในกรณีที่เว็บไซต์มีมากกว่าหนึ่ง)

นี่คือกรณีที่มี XML sitemap ของเราเองบนบล็อกนี้ ให้ฉันแสดงให้ดู:

URL del sitemap SEOcrawl
URL del sitemap SEOcrawl

และนี่คือลักษณะของมัน:

Listado de sitemaps de SEOcrawl
Listado de sitemaps de SEOcrawl

โดยพื้นฐาน เหล่านี้คือ sitemaps แยกทั้งหมดที่แบ่งตามประเภทของโพสต์ที่พวกเขามีอยู่ภายใน

ตอนนี้ หากเรายังโชคไม่ดี มาลองตัวเลือกเพิ่มเติม:

  • /sitemap-index.xml - /sitemap.php - /sitemap.txt - /sitemap.xml.gz - /sitemap/ - /sitemap/sitemap.xml - /sitemapindex.xml - /sitemap/index.xml - /sitemap1.xml

หมายเหตุ: ไฟล์ XML เป็นเพียงหนึ่งในวิธีอธิบาย sitemap ยังมีรูปแบบ RSS และ Atom

ดังนั้น เราต้องเพิ่มตำแหน่ง sitemap ที่เป็นไปได้เพิ่มเติม:

  • /rss/ - /rss.xml - /atom.xml

เราจะพูดเพิ่มเติมเกี่ยวกับพวกเขาในภายหลัง

เพื่อยืนยัน - เราควรใส่ชื่อโดเมนของเว็บไซต์ก่อน "/" ในขณะที่ลองทางเลือกต่าง ๆ

2) ตรวจสอบไฟล์ Robots.txt

หากคุณยังอยู่กับเรา นั่นหมายความว่าคุณล้มเหลวในการค้นหาไฟล์ซึ่งเป็นวัตถุประสงค์หลักของบทความของเรา หรือคุณเพียงอยากรู้และหลงใหลที่จะเรียนรู้เพิ่มเติม

จริง ๆ แล้ว ไม่ว่าจะด้วยเหตุผลใด ฉันมีข่าวดีให้คุณ - เราจะดำเนินการเดินทางของเราด้วย เคล็ดลับง่าย ๆ อีกอย่าง

Robots.txt เป็นไฟล์พิเศษที่รู้จักกับ SEO (และโปรแกรมเมอร์ด้วย) ที่ให้ คำสั่งที่มีประโยชน์ กับ search engine crawlers ยิ่งไปกว่านั้น นี่ยังเป็นที่ที่คุณสามารถ ค้นหาลิงก์ไปยัง sitemap ของเว็บไซต์ได้บ่อยมาก

ความคิดคือเมื่อ search engines เยี่ยมชมไฟล์ robots.txt เหล่านี้ การเพิ่มลิงก์ไปยัง sitemap ที่นั่นมีเหตุผลที่สมบูรณ์แบบ ด้วยวิธีนั้น มันจะง่ายกว่าสำหรับพวกเขา ตรวจจับ sitemap ในตอนแรกและรวบรวมข้อมูลเว็บไซต์

คุณพร้อมสำหรับข่าวดีอีกอย่างไหม?! นี่คือ - เพื่อเข้าถึงไฟล์ robots.txt ของเว็บไซต์ คุณเพียงต้องเพิ่ม /robots.txt ให้กับชื่อโดเมนของคุณในเบราว์เซอร์และกด "Enter" คล้ายกับขั้นตอนก่อนหน้าที่เรากำลังเพิ่มเส้นทาง sitemap ที่เป็นไปได้ต่าง ๆ

อะไรทำงานได้ดีกว่าตัวอย่างจริง? ดูที่อยู่ URL ของไฟล์ robots.txt ของเราเอง:

https://seocrawl.com/robots.txt

มันเป็นไฟล์เล็ก ๆ แต่ง่ายและมีประโยชน์พร้อมฟังก์ชันที่สำคัญบางอย่าง ในกรณีที่คุณเปิดแล้ว คุณจะสามารถเห็น เกือบทันที อัญมณีเล็ก ๆ ที่คุณกำลังมองหา - ไฟล์ sitemap:

Robots seocrawl
Robots seocrawl

Voilà! ฉันสัญญาว่าจะง่าย :)

3) ตรวจสอบ Google Search Console

โอเค ยังไม่พบ sitemap? ไม่มีปัญหา! เรามีเคล็ดลับเพิ่มเติมสำหรับคุณที่จะช่วยให้เราหาทาง

ให้ฉันแสดงวิธีที่ง่ายและรวดเร็วอีกอย่าง

Google Search Console (ที่รู้จักในชื่อ Webmaster Tools ในอดีต) เป็นอีกหนึ่งสถานที่ในการค้นหาเส้นทางที่เรากำลังมองหา แน่นอน เพื่อให้สิ่งนี้เป็นไปได้ คุณต้องเป็นเจ้าของเว็บไซต์หรือได้รับอนุญาตการเข้าถึง

หากคุณตรงตามเกณฑ์เหล่านี้ ขั้นตอนต่อไปคือเข้าสู่ระบบ GSC และจากเมนูทางซ้ายเลือก Sitemaps:

Sitemaps in Google Search Console
Sitemaps in Google Search Console

ตอนนี้ ในกรณีที่ sitemap (หรือ sitemaps) ถูกส่งโดยคนอื่นในอดีตแล้ว คุณจะสามารถเห็นได้ทันที:

Submitted sitemaps
Submitted sitemaps

พร้อมกับที่อยู่ URL ที่แน่นอนของ sitemap มี ข้อมูลเพิ่มเติม เช่นประเภทของ sitemap (ไฟล์ดัชนีที่มี sitemaps อื่นในตัวหรือ sitemaps ปกติพร้อมหน้าของเว็บไซต์) เมื่อถูกส่ง อ่านล่าสุด สถานะ และจำนวน URL ภายใน

เคล็ดลับ: หากคุณจริงจังกับ SEO และปรับปรุงประสิทธิภาพ organic ของเว็บไซต์ของคุณ Google Search Console เป็นเครื่องมือที่ต้องมี ข้อมูลเชิงลึกที่คุณสามารถได้รับจากมันมีจำนวนมาก

นอกจากนี้ โบนัสเพิ่มเติมคือการมี GSC ช่วยให้คุณลองใช้เครื่องมือที่ทรงพลังของเรา - SEOcrawl

4) ตรวจสอบ Bing Webmaster Tools

ข่าวดีคือ Bing Webmaster Tools ทำงานเกือบเหมือนกับ Google Search Console ไม่น่าแปลกใจที่อันหลังเคยถูกเรียกว่า Google Webmaster Tools เนื่องจากพวกเขามีหลายอย่างที่เหมือนกัน

อีกครั้ง คุณต้องเข้าสู่ระบบและจากนั้นนำทางไปยัง sidebar ทางซ้าย ที่คุณจะมีส่วน "Sitemaps" พร้อมใช้งาน

Sitemaps in Bing Webmaster Tools
Sitemaps in Bing Webmaster Tools

คลิกที่มัน และในกรณีที่มี sitemap/sitemaps ถูกส่งแล้ว คุณจะสามารถสำรวจเพิ่มเติมได้

Submited sitemaps in Bing Webmaster Tools
Submited sitemaps in Bing Webmaster Tools

วิธีขั้นสูงในการค้นหา Sitemap ของคุณ

ยังอยู่กับเรา? โอเค นั่นหมายความว่าคุณยังคงมองหาตำแหน่งไฟล์ sitemap ที่มีค่านั้น หรือคุณกล้ามากที่จะเข้าสู่ ส่วนขั้นสูง ในทั้งสองกรณี ฉันต้องการ แสดงความยินดี กับคุณที่มาถึงไกลและขอให้คุณโชคดี :)

ฉันสัญญาว่าจะไม่ซับซ้อนและน่ากลัวขนาดนั้น! ไปกัน!

5) ใช้ Google Search Operators

Google search operators (ที่รู้จักในชื่อ commands) สามารถมีพลังมากสำหรับเป้าหมาย SEO ต่าง ๆ (เช่น ค้นหาโอกาส link building, ไอเดียเนื้อหา, ค้นพบปัญหาเชิงเทคนิค และอีกมากมาย) อย่างไรก็ตาม ในกรณีนี้ เราจะใช้พวกเขาเพื่อค้นหา XML sitemap ของเว็บไซต์ที่เรากำลังตรวจสอบ

สำหรับสิ่งนั้น เราต้องใช้ประโยชน์จากคำสั่ง "filetype:" จะมีประโยชน์จริง ๆ เมื่อรวมกับคำสั่ง "site:" โดยพื้นฐาน การรวมกันของทั้งสองจะค้นหาเฉพาะประเภทไฟล์ในเว็บไซต์ที่เราต้องการ

ตัวอย่าง: site:chess.com filetype:xml

และนี่คือสิ่งที่การค้นหานี้จะนำมาใน Google:

Use Google Search Operators to find sitemaps
Use Google Search Operators to find sitemaps

ที่นี่เรามี! sitemaps ที่จัดทำดัชนีทั้งหมด ของเว็บไซต์ถูกแสดงใน Google และเราสามารถสำรวจเพิ่มเติมได้

ในกรณีที่มี ผลลัพธ์ที่ไม่เกี่ยวข้อง แสดง คุณสามารถปรับการค้นหาเพิ่มเติม คราวนี้เราจะเพิ่มตัวดำเนินการ "inurl" ในคลังของเรา

ตัวอย่างเช่น: site:uefa.com filetype:xml inurl:sitemap

Operator inurl to find sitemaps
Operator inurl to find sitemaps

หมายเหตุ: ดังที่เรากล่าวข้างต้น sitemaps อาจเป็นไฟล์ข้อความด้วย เพื่อค้นหาพวกเขา เราสามารถทำการค้นหาที่คล้ายกันแต่ด้วยส่วนขยายที่แตกต่างกัน

ตัวอย่างเช่น: site:WebsiteURL inurl:sitemap filetype:txt

และสิ่งนี้จะส่งผลในต่อไปนี้:

Operator filetype to find sitemaps
Operator filetype to find sitemaps

เคล็ดลับ: คำสั่งเหล่านี้จะเปิดเผยตำแหน่งของ sitemap เฉพาะหากถูกจัดทำดัชนีโดย Google ปลั๊กอิน WP บางตัวที่สร้าง sitemaps อัตโนมัติเพิ่มแท็ก no follow, no index ให้กับ Sitemaps ดังนั้น หากคุณจบลงด้วยการไม่พบผลลัพธ์ อย่ากังวล!

มาดำเนินการต่อด้วยไอเดียถัดไป

SEO Site checkup
SEO Site checkup

6) ใช้เครื่องมือออนไลน์

อีกหนึ่งเทคนิคคือลองใช้เครื่องมือออนไลน์เช่น SEO Site Checkup ที่คุณเพียงต้องวาง URL เว็บไซต์ของคุณและกด Checkup จากนั้นคุณจะได้สิ่งนี้: หมายเหตุ: วิธีที่เครื่องมือนี้ทำงานคือตรวจสอบตำแหน่ง sitemap มาตรฐานที่เรากล่าวถึงก่อนหน้านี้ (sitemap.xml, sitemap1.xml, sitemapindex.xml และอื่น ๆ) ดังนั้น อาจไม่พบเว็บไซต์ของคุณในกรณีเฉพาะอื่น ๆ

7) ตรวจสอบ CMS ของเว็บไซต์

ขึ้นอยู่กับระบบจัดการเนื้อหาที่เว็บไซต์ทำงานอยู่ XML sitemaps อาจอยู่ในที่ต่างกัน ข่าวดีคือ CMS ที่นิยมที่สุดมี ตำแหน่งเริ่มต้น ที่คุณอาจต้องการเริ่มการค้นหาของคุณ

ก่อนอื่น เราต้อง ระบุ CMS ของเว็บไซต์ มันเป็นกระบวนการที่ค่อนข้างง่ายและเราสามารถใช้ทั้งเครื่องมือออนไลน์หรือส่วนขยายเบราว์เซอร์

ตัวอย่างเช่น addon ที่มีประโยชน์อย่างหนึ่งคือ Built With ที่ระบุไม่เพียงแค่ CMS แต่ซอฟต์แวร์และโปรแกรมอีกหลายตัวที่เว็บไซต์กำลังใช้ นี่คือวิธีที่แสดงข้อมูลที่คุณกำลังมองหา:

Addon Built With to identify de CMS
Addon Built With to identify de CMS

หากคุณต้องการเครื่องมือออนไลน์ ทางออกที่เป็นไปได้คือ WhatCMS:

What CMS para SEOcrawl
What CMS para SEOcrawl

ทางเลือกคือ CMS Detect:

CMS detect SEOcrawl
CMS detect SEOcrawl

ตอนนี้ เมื่อเรารู้ CMS ที่แน่นอน มาสำรวจระบบจัดการเนื้อหาที่นิยมที่สุดและที่พวกเขามักเก็บไฟล์ XML

Wordpress

ก่อนปี 2020 วิธีที่ sitemaps ถูกสร้างส่วนใหญ่ผ่านปลั๊กอิน อย่างไรก็ตาม ทุกวันนี้ ด้วยฟังก์ชัน WP ในตัว ควรอยู่ที่ /wp-sitemap.xml

อย่างไรก็ตาม ในกรณีที่เว็บไซต์ที่คุณกำลังตรวจสอบใช้ปลั๊กอินสำหรับการสร้าง sitemap คุณสามารถลองด้วยตำแหน่งบางอย่างต่อไปนี้:

  • /sitemap.xml - /tag-sitemap.xml - /sitemap_index/xml - /category-sitemap.xml

หรือคุณสามารถตรวจสอบการตั้งค่าของปลั๊กอินและค้นหาเส้นทางที่นั่น

Wix, Shopify, Joomla, Squarespace, Magento

ข่าวดีคือทั้งหมดเหล่านี้สร้าง XML sitemaps อัตโนมัติสำหรับผู้ใช้ ดังนั้น ตำแหน่งเริ่มต้น (หากไม่ได้แก้ไขเพิ่มเติม) คือ: /sitemap.xml

ด้วยหมายเหตุว่าชื่อโดเมนไปก่อนส่วน "/"

โบนัส: Bookmarklet สำหรับการค้นหา Sitemap.xml ทันที

ในกรณีที่คุณเป็นแฟนของ ผลผลิต และประหยัดเวลาจากทุกงานเล็ก (ไม่ใช่ทุก SEO เป็นแบบนั้นหรือ?!) คุณอาจพบ bookmarklet ที่มีประโยชน์ด่วนเพื่อตรวจสอบ XML sitemap ของเว็บไซต์ทันที

คุณเพียงต้องเพิ่มรหัส javascript นี้:

javascript:void(location.href='http://' + location.host + '/sitemap.xml')

บุ๊กมาร์กและทุกครั้งที่คุณคลิกจะเปิดไฟล์ Sitemap ในกรณีที่อยู่ในตำแหน่ง /sitemap.xml เริ่มต้น

รวดเร็วและง่าย!

การค้นหา Sitemaps ประเภทอื่น

เราพูดถึงส่วนใหญ่เกี่ยวกับ XML sitemaps เนื่องจากเป็นรูปแบบที่พบบ่อยที่สุดในการแสดง crawlers ว่าเกิดอะไรขึ้นบนโดเมนของคุณ อย่างไรก็ตาม ควรกล่าวถึงประเภทอื่น ๆ ที่สามารถพบบนเว็บไซต์บางแห่ง

  • HTML เหล่านี้มักถูกสร้างเพื่อให้ผู้ใช้สะดวกขึ้นและมีประโยชน์มากโดยเฉพาะสำหรับเว็บไซต์ขนาดใหญ่

ตัวอย่างเช่น Ebay ให้ผู้เยี่ยมชม "แผนที่" เสมือนพร้อมหน้าหลักและหมวดหมู่: https://pages.ebay.com/sitemap.html

Html sitemap
Html sitemap

  • RSS ในบางกรณีเว็บไซต์ใช้ RSS feed เป็น sitemap ซึ่งมักจะอยู่ที่: /rss/ หรือ /rss.xml

  • Atom ใช้เช่นเดียวกันสำหรับ Atom feed และคุณสามารถพบได้มักเป็น: /atom.xml - TXT นี่คือไฟล์ข้อความมาตรฐานอย่างที่เราพูดคุยกันแล้วตัวอย่างหนึ่ง ตำแหน่ง: /sitemap.txt

ไม่มี sitemap? ทำอย่างไรในกรณีนี้?

หลังจากผ่านตัวเลือกต่าง ๆ ในการค้นหา sitemap แล้ว ควรพูดสักสองสามคำเกี่ยวกับสิ่งที่ต้องทำ หากไม่มี sitemap ที่สร้างแล้ว นี่จะเป็นกรณีของเว็บไซต์ใหม่ที่อยู่ออนไลน์เป็นระยะเวลาสั้น หรือเว็บไซต์ขนาดเล็กและขนาดเล็กบางแห่ง

นอกจากนี้ โปรดทราบว่าไม่ใช่ทุกเว็บไซต์ที่ต้องการ sitemaps หากเว็บไซต์มีเพียงหน้าไม่กี่หน้า คุณจะทำได้ดีแม้ไม่มีหนึ่ง

อย่างไรก็ตาม หากคุณยินดีที่จะ สร้าง XML sitemap ของคุณ คุณสามารถใช้ปลั๊กอินที่เข้ากันได้กับระบบ CMS ของคุณ ตัวอย่างที่ดีบางอย่างสำหรับ WP คือ:

  • Rank Math Sitemap Plugin - WP Sitemap Plugin - Google XML Sitemaps - WordPress SEO by Yoast

หรือคุณสามารถสร้าง sitemap ด้วยตนเองหรือใช้ crawler เพื่อผ่านเว็บไซต์ของคุณและส่งออก sitemap สำหรับการอัปโหลด

สรุป:

ฉันหวังว่าเคล็ดลับเหล่านี้จะช่วยคุณดำดิ่งลึกเข้าสู่โลกของ Sitemaps และตอนนี้คุณคุ้นเคยกับ วิธีที่พวกเขาทำงาน ทำไมเราต้องการพวกเขา... และแน่นอน วิธีค้นหาพวกเขา

แจ้งเราในความคิดเห็นหากมีอะไรอื่นที่คุณอยากรู้หรือเพียงแบ่งปันประสบการณ์ของคุณ :)

โชคดี!

โดย: Ognian Mikov

Ognian Mikov

SEO เข้ามาในชีวิตผมในปี 2012 และตั้งแต่นั้นมาผมก็ใช้ชีวิตกับมันอย่างเต็มที่ SEO สำหรับผมเป็นมากกว่างาน — เป็นแพสชันและงานอดิเรกที่ผลักดันให้ผมเรียนรู้และพัฒนาตลอดเวลา ไม่ว่าผมจะค้นคว้าหัวข้อใหม่ สร้างเนื้อหา หรือเจาะลึกการแก้ไขทางเทคนิค โลกอันกว้างใหญ่ของการตลาดดิจิทัลและโอกาสไม่สิ้นสุดในการปรับปรุงประสิทธิภาพเว็บไซต์ทำให้ผมหลงใหลเสมอ

ผมจบปริญญาตรีด้านการตลาดและปริญญาโทด้านประชาสัมพันธ์และโฆษณา ในเวลาว่างผมชอบใช้เวลากับลูกสาวและเล่นหรือดูหมากรุกและฟุตบอล (Само Левски และ Més que un club) และโป๊กเกอร์

→ อ่านบทความทั้งหมดของ Ognian
บทความเพิ่มเติม: Ognian Mikov

ค้นพบเนื้อหาเพิ่มเติมของผู้เขียนคนนี้