รายงาน Crawl Stats ใหม่ใน Google Search Console

รายงาน Crawl Stats ใหม่ใน Google Search Console
David Kaufmann
บทเรียน SEO
2 min read

ในช่วงปลายเดือนพฤศจิกายน 2020 Google เปิดตัวรายงานสถิติการรวบรวมข้อมูลใหม่อีกครั้ง และดูเหมือนว่าโลก SEO เชิงเทคนิคจะสะเทือน รายงานนี้เรียกว่า Crawl Stats และจากรายงานนี้ คุณจะสามารถเรียนรู้ว่าบอตต่าง ๆ ของ Google เยี่ยมชมเว็บไซต์ของคุณอย่างไร และได้รับข้อมูลเชิงลึกที่มีค่าจากข้อมูลที่มีประโยชน์นี้

Google Crawl Stats คืออะไร?

นี่คือ การปรับปรุงครั้งใหญ่ของส่วน "crawl stats" ที่เคยมีอยู่ใน Webmaster Tools เก่า ด้วยรายงานนี้ เราสามารถเข้าถึงข้อมูลและสถิติต่าง ๆ เกี่ยวกับประวัติการรวบรวมข้อมูลของ Googlebot บนเว็บไซต์ของเรา ในเวอร์ชันใหม่ มันกลายเป็นเครื่องมือสำหรับทำงาน ในระดับหนึ่ง กับ logs และไม่ได้เป็นเพียงแผนภูมิแสดงผลอีกต่อไป

คุณสามารถเข้าถึงรายงานนี้จากบัญชี Search Console ของคุณได้ภายใต้ Settings > Crawl stats

สิ่งใหม่ในรายงานที่ปรับปรุงใหม่

มีฟีเจอร์ใหม่หลายอย่าง:

  • จำนวนคำขอบอตทั้งหมดที่จัดกลุ่ม ตามรหัสตอบสนอง ประเภทของไฟล์ที่ถูกรวบรวมข้อมูล วัตถุประสงค์การรวบรวมข้อมูล และประเภทของ Googlebot บางส่วนจะมีประโยชน์มาก
  • ข้อมูลรายละเอียดเกี่ยวกับ สถานะของ host
  • ตัวอย่าง URL เพื่อแสดงว่าคำขอต่าง ๆ เกิดขึ้นที่ใดในเว็บไซต์
  • สรุปทั้งหมดของพร็อพเพอร์ตี้ที่มีหลาย hosts และรองรับ domain properties

ส่วนต่าง ๆ ของเครื่องมือวิเคราะห์ log ของ Google

เราขอเชิญคุณเดินทางผ่านส่วนต่าง ๆ ของ Crawl Stats จะมาด้วยกันไหม?

แผนภูมิ crawl stats

แผนภูมิใหม่นี้ ปรับให้เข้ากับการออกแบบ Search Console ปัจจุบันแล้ว แสดงสถิติการรวบรวมข้อมูลตามช่วงเวลา ในนั้นคุณสามารถดูสามเมตริกได้:

  • คำขอรวบรวมข้อมูลทั้งหมด ตามช่วงเวลา หรือเป็นรายวันหากคุณวางเคอร์เซอร์ไว้บนแผนภูมิ
  • ขนาดข้อมูลที่ดาวน์โหลดทั้งหมด เป็น bytes
  • เวลาตอบสนองเฉลี่ย เป็น milliseconds

Google Crawl Stats
Google Crawl Stats

จนถึงตอนนี้ยังไม่มีอะไรใหม่มาก เป็นเพียงการเปลี่ยนแปลงอินเทอร์เฟซ แต่มาดูส่วนต่อไป...

การรวบรวมข้อมูลของ hosts ต่าง ๆ ใน domain property ของคุณ

domain property ของคุณใน Search Console อาจประกอบด้วย hosts หลายตัว เช่น เวอร์ชันที่มีและไม่มี www หรือ subdomain ใด ๆ ที่คุณมี แผนภูมินี้ให้คุณเห็นว่า Googlebot รวบรวมข้อมูลพวกมันอย่างไร และคุณสามารถคลิกที่แต่ละตัวเพื่อรับข้อมูลส่วนบุคคลที่กรองแล้วได้

domain property hosts
domain property hosts

ในส่วนนี้ เรามีตัวบ่งชี้ 3 ตัวที่บอกเราได้เยอะในแวบเดียว:

No significant availability issues icon
No significant availability issues icon
ไม่พบปัญหาการรวบรวมข้อมูลใน 90 วันที่ผ่านมา

Some availability issues, but not recently
Some availability issues, but not recently
มีปัญหาการรวบรวมข้อมูลบางอย่างบนเว็บไซต์ของคุณในช่วง 90 วันที่ผ่านมา แต่เกิดขึ้นมากกว่าหนึ่งสัปดาห์ที่แล้ว

Recent availability issue
Recent availability issue
พบข้อผิดพลาดอย่างน้อยหนึ่งรายการในช่วง 7 วันที่ผ่านมา ถึงเวลาแก้ไขแล้ว!

การจัดกลุ่มใหม่ของลักษณะการรวบรวมข้อมูล

ตอนนี้เราสามารถจัดหมวดหมู่การเข้าชมของ Googlebot ในมิติการรวบรวมข้อมูลหลายอย่าง:

  • โดยการตอบสนอง: ด้วยวิธีนี้ เราจะรู้การเปลี่ยนเส้นทางและหน้าผิดพลาดที่ Googlebot ผ่านในช่วงเวลาที่ระบุ
  • โดยประเภทไฟล์: Googlebot อาจใช้เวลาในการรวบรวมข้อมูลกับประเภทไฟล์ที่เราไม่สนใจ ด้วยการจัดกลุ่มนี้ เราจะรู้
  • โดยวัตถุประสงค์: ที่นี่เราสามารถแยกความแตกต่างระหว่างเปอร์เซ็นต์ของการรวบรวมข้อมูลที่อุทิศให้กับหน้าที่รู้จักอยู่แล้วและการค้นหา URL ใหม่
  • โดยประเภทบอตของ Google: เรารู้ว่า Google มีบอตประเภทต่าง ๆ และแต่ละตัวมีฟังก์ชันของตัวเอง ในรายงานนี้ เราจะเห็นว่าแต่ละตัวเยี่ยมชมเราบ่อยแค่ไหน

คุณจะสามารถเจาะลึกแต่ละรายการและดูตัวอย่าง URL ได้ อย่างไรก็ตาม เป็นเพียงตัวอย่างเท่านั้น ไม่ใช่ทุก URL ที่คุณเห็นในรายงานจะพร้อมใช้งาน คุณสามารถสังเกตรูปแบบได้ แต่ไม่สามารถดาวน์โหลดข้อมูลทั้งหมดและทำงานจากข้อมูลนั้นได้

crawl groupings
crawl groupings

ข้อสรุปเกี่ยวกับเครื่องมือ

นี่คือการปรับปรุงที่ ช่วยตรวจจับปัญหาการรวบรวมข้อมูลที่สำคัญ บนเว็บไซต์ในวิธีที่ง่ายและฟรี เราไม่คิดว่ามันจะมาแทนที่เครื่องมือวิเคราะห์ log อย่าง Kibana หรือ Screaming Frog Log File Analyzer เพราะ สิ่งที่ Google เสนอให้เราเป็นตัวอย่าง ไม่ใช่ข้อมูลที่แม่นยำ ด้วยเหตุนี้สำหรับโปรเจกต์ที่มีข้อกำหนดพิเศษ จึงไม่สามารถแทนที่ได้ สรุป เราจะสามารถแก้ไขปัญหาได้มากมาย แต่ไม่สามารถวิเคราะห์การรวบรวมข้อมูลที่ Google ทำกับเว็บไซต์ของเราได้อย่างเต็มที่ จำไว้ว่านี่คือฟีเจอร์ที่เพิ่งเปิดตัว และในขณะนี้ เรายังไม่รู้ว่ามันจะพัฒนาอย่างไร

โดย: David Kaufmann

David Kaufmann

ในช่วง 10+ ปีที่ผ่านมา ผมหมกมุ่นกับ SEO อย่างสมบูรณ์ — และพูดตรง ๆ ก็ไม่อยากให้เป็นแบบอื่น

อาชีพของผมก้าวขึ้นไปอีกระดับเมื่อทำงานเป็นผู้เชี่ยวชาญ SEO อาวุโสที่ Chess.com — หนึ่งใน 100 เว็บไซต์ที่มีผู้เข้าชมมากที่สุดในอินเทอร์เน็ต การทำงานในระดับนี้สอนสิ่งที่ไม่มีหลักสูตรหรือประกาศนียบัตรใดสอนได้

จากประสบการณ์นี้ ผมก่อตั้ง SEO Alive — เอเจนซีสำหรับแบรนด์ที่จริงจังกับการเติบโตแบบออร์แกนิก และเพราะหาเครื่องมือที่จัดการทั้งโลกคลาสสิกและยุค AI ได้ดีไม่ได้ ผมจึงสร้าง SEOcrawl ขึ้น หากคุณกำลังมองหาพาร์ตเนอร์ SEO มากประสบการณ์ที่รักสาขานี้ — ยินดีพูดคุยครับ!

→ อ่านบทความทั้งหมดของ David
บทความเพิ่มเติม: David Kaufmann

ค้นพบเนื้อหาเพิ่มเติมของผู้เขียนคนนี้