Googlebot Evergreen: Trình thu thập dữ liệu mới của Google

Thế giới SEO có lý do để ăn mừng nhờ bài viết mới nhất được xuất bản bởi nhóm Google Webmasters, thông báo rằng phiên bản mới của Googlebot, được gọi là GoogleBot Evergreen, cũng sẽ có sẵn cho các công cụ webmaster.
Dưới đây, chúng ta sẽ xem xét những hệ quả mà điều này mang lại ở cấp độ triển khai kỹ thuật từ góc độ SEO.
1) GoogleBot Evergreen là gì?
Cho đến gần đây, Bot của Google (trình thu thập dữ liệu) đã sử dụng Google Chrome 41 để phân tích tất cả các website trên Internet. Xét đến việc Google Chrome hiện đã ở phiên bản 78, bạn có thể tưởng tượng GoogleBot tụt hậu đến mức nào so với trình duyệt của nó. Tuy nhiên, tại sự kiện Google I/O gần đây, họ đã thông báo nhiều cải tiến về vấn đề này. Chính là từ đó trở đi, không chỉ GoogleBot sẽ sử dụng phiên bản mới của Chrome, mà bản cập nhật của nó sẽ được liên kết để nó luôn sử dụng các phiên bản mới nhất.

Google công bố engine render mới: GoogleBot Evergreen
Dưới đây, bạn có thể xem video từ nhóm Search, trong đó họ đã thông báo lớn về GoogleBot Evergreen và cũng thảo luận về số liệu thống kê về thế giới SEO và kế hoạch của Google cho các dự án và cải tiến sắp tới của họ vào năm 2019.
Đó là một video dài 40 phút nhưng thực sự đáng xem. Đầu tiên, vì nó có sự xuất hiện của có lẽ là 2 chuyên gia SEO lớn nhất tại Google, và thứ hai, vì họ tập trung vào sự phát triển của thế giới SEO và cách chúng ta có thể thích ứng để cung cấp nội dung tốt nhất cho người dùng.
2) Ý nghĩa
Thay đổi cơ bản và quan trọng nhất khi chuyển từ Chrome 41 sang Chromium (các phiên bản mới nhất) là từ bây giờ, GoogleBot có thể thực thi Javascript và render trang. Cho đến nay, quá trình này chậm hơn nhiều hoặc thậm chí là không thể trừ khi sử dụng các công cụ nhất định để tạo các trang tĩnh cho bot (Prerender.io, Puppeteer...) nếu trang được xây dựng bằng phần mềm JavaScript hiện đại (Vue...). Tuy nhiên, với cải tiến này, Google sẽ có thể hiểu được nhiều trang hơn mà trước đây không thể truy cập.
Trong hình sau, bạn có thể thấy GoogleBot cũ với Chrome 41 hiểu một trang như thế nào và cách nó xử lý nội dung với phiên bản mới.

Ví dụ về cách GoogleBot xem một trang trước và sau khi thay đổi.
Đối với các công ty lớn có đội ngũ kỹ thuật rộng rãi, đây không phải là vấn đề lớn vì họ có thể phân bổ nguồn lực cần thiết. Tuy nhiên, đối với các doanh nghiệp vừa và nhỏ, đây có thể là một cơn đau đầu thực sự. Đó là lý do tại sao thay đổi này có thể giúp nhiều công ty đảm bảo rằng nội dung của họ có thể được thu thập và lập chỉ mục đúng cách.
Bây giờ, nếu bạn đang nghĩ về trang của mình và tự hỏi nó có thể ảnh hưởng đến bạn như thế nào, hãy lưu ý rằng theo chính nhóm Google, câu trả lời là "không nên", vì về nguyên tắc, các thay đổi thậm chí không nên đáng chú ý. Tại sao?
- Công nghệ này đã được kiểm tra kỹ lưỡng.
- Phân tích đã được thực hiện trong vài tháng trên nhiều website.
- User-agent sẽ không được thay đổi mà không có thông báo trước để tránh phá vỡ các sơ đồ theo dõi/ghi nhật ký...
Một trong những thay đổi lớn được thông báo trong tuần này là engine render mới này cũng đã được áp dụng cho công cụ SEO dành cho Webmasters để tất cả các chuyên gia SEO có thể thực hiện tất cả các loại kiểm tra và phân tích:
3) Mobile First Index
Một tin tức lớn khác đi kèm với thông báo GoogleBot Evergreen là thông báo về những thay đổi liên quan đến thế giới Mobile.

Có lẽ, vào cuối năm 2019, tất cả các website trên Internet sẽ được thu thập dữ liệu thông qua GoogleBot Mobile.
Nhóm Google Search đã tiết lộ một số thống kê thực sự ấn tượng:
- Hơn 50% website đang được phân tích bằng GoogleBot Mobile.
- Vào cuối năm 2019 hoặc đầu năm 2020, Google có thể đang phân tích 100% Internet bằng GoogleBot Mobile.
- GoogleBot thu thập dữ liệu hơn 130 nghìn tỷ trang.
- Tốc độ trang của bạn trên thiết bị di động là một yếu tố xếp hạng và có tác động trực tiếp đến chuyển đổi, thời gian trên trang và các yếu tố quan trọng khác cho bất kỳ doanh nghiệp nào.
4) Cập nhật
Vì đây là một chủ đề luôn thay đổi, chúng tôi đã tạo phần này để xuất bản tất cả các tin tức liên quan đến engine của Google.
Ngày 2 tháng 10 năm 2019: Google thông báo rằng bắt đầu từ tháng 12 năm 2019, user-agent của GoogleBot sẽ được điều chỉnh để phản ánh phiên bản mới nhất của trình duyệt và sẽ được cập nhật theo các phiên bản mới nhất của Chrome.
Đây là các user-agent hiện tại:
- Mobile:
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.96 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
- Desktop
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) Tuy nhiên, bắt đầu từ tháng 12, các user-agent mới sẽ như sau:
- Mobile
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
- Desktop
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) ** Các ký hiệu "W.X.Y.Z" sẽ được thay thế bằng các phiên bản Google Chrome khi chúng được phát hành. *
Bạn có câu hỏi, thắc mắc hoặc gợi ý về những gì bạn vừa đọc không? Chúng tôi rất muốn nghe ý kiến của bạn! Cảm ơn bạn rất nhiều vì đã đóng góp vào kiến thức được chia sẻ trong thế giới SEO.
** Tất cả hình ảnh đều thuộc bản quyền của Google (video YouTube). *
Tác giả: David Kaufmann

Tôi đã dành hơn 10 năm qua hoàn toàn đắm chìm trong SEO — và thành thật mà nói, tôi không muốn điều gì khác thay thế.
Sự nghiệp của tôi bước sang một tầm cao mới khi tôi làm việc với vai trò chuyên gia SEO cấp cao tại Chess.com — một trong 100 website được truy cập nhiều nhất trên toàn bộ internet. Vận hành ở quy mô đó, trên hàng triệu trang, hàng chục ngôn ngữ và trong một trong những SERPs cạnh tranh khốc liệt nhất, đã dạy tôi những điều mà không khóa học hay chứng chỉ nào có thể mang lại. Trải nghiệm đó đã thay đổi cách tôi nhìn nhận về SEO thực sự xuất sắc — và trở thành nền tảng cho mọi thứ tôi xây dựng từ đó đến nay.
Từ kinh nghiệm ấy, tôi đã sáng lập SEO Alive — một agency dành cho những thương hiệu thực sự nghiêm túc với tăng trưởng organic. Chúng tôi không ở đây để bán dashboards và báo cáo hàng tháng. Chúng tôi ở đây để xây dựng những chiến lược thực sự tạo ra chuyển biến, kết hợp tinh hoa của SEO truyền thống với thế giới mới đầy thú vị của Generative Engine Optimization (GEO) — đảm bảo thương hiệu của bạn không chỉ xuất hiện trong các liên kết xanh của Google, mà còn hiện diện ngay trong những câu trả lời do AI tạo ra mà ChatGPT, Perplexity và Google AI Overviews đang cung cấp cho hàng triệu người mỗi ngày.
Và bởi vì tôi không thể tìm được một công cụ xử lý tốt cả hai thế giới đó, tôi đã tự xây dựng một công cụ — SEOcrawl, một nền tảng SEO intelligence cấp doanh nghiệp tích hợp rankings, kiểm tra kỹ thuật, giám sát backlinks, tình trạng crawl và theo dõi hiển thị thương hiệu trên AI, tất cả trong một nơi. Đó chính là nền tảng mà tôi luôn ước có.
Khám phá thêm nội dung của tác giả này

