Cloaking trong SEO: Cloaking là gì và tại sao Google trừng phạt nó

Có nhiều kỹ thuật xếp hạng trên công cụ tìm kiếm, nhưng chúng ta có thể phân biệt giữa những kỹ thuật tốt hoặc cẩn thận được bao gồm trong "White Hat SEO" và những thực hành nguy hiểm hoặc xấu được gọi là "Black Hat SEO". Tất cả phụ thuộc vào mức độ minh bạch và đạo đức của chúng ta với tư cách là chuyên gia SEO trên website khi giao dịch với công cụ tìm kiếm. Ngày nay, thuật toán của Google ngày càng tinh vi hơn và càng khó đánh lừa, vì vậy một số kỹ thuật ít đạo đức sẽ rơi vào tình trạng không sử dụng.
Một trong số đó được gọi là cloaking và đã có "thời kỳ bùng nổ" cách đây nhiều năm. Bây giờ nó hầu như không được sử dụng, nhưng việc hiểu nó là điều cần thiết để đảm bảo rằng nó không có mặt trên bất kỳ website nào chúng ta quản lý.
Cloaking trong SEO là gì?
Cloaking là một kỹ thuật che giấu, có tên xuất phát từ tiếng Anh và có nghĩa là "che đậy", và bao gồm việc hiển thị nội dung khác nhau từ cùng một website cho người dùng và cho Googlebot khi họ thực hiện yêu cầu đến máy chủ về nội dung của website họ truy cập.
Kỹ thuật này thuộc về Black Hat SEO nổi tiếng, hay tập hợp các kỹ thuật và chiến lược lừa dối, phi đạo đức nhằm cải thiện xếp hạng của website bằng cách lừa dối Google.
Quá trình thu thập dữ liệu diễn ra như thế nào?
Để hiểu cách thức hoạt động của chiến lược Cloaking, chúng ta cần biết quá trình thu thập dữ liệu của bot là như thế nào. Quá trình thu thập dữ liệu và lập chỉ mục được thực hiện bởi các con nhện chịu trách nhiệm nhận dạng các website. Con nhện của Google được gọi là Googlebot, cùng với hai phiên bản khác nhau của nó là deepbot và freshbot. Phiên bản đầu tiên chịu trách nhiệm theo dõi kỹ lưỡng tất cả các liên kết có trong nội dung của website và truy cập trang web. Phiên bản thứ hai chịu trách nhiệm tìm kiếm nội dung mới trên web.
Nguồn gốc của nó là gì?
Nguồn gốc của Cloaking có thể được truy nguyên đến các website có nội dung video, đồ họa hoặc hoạt hình có khó khăn lớn hơn trong việc xếp hạng trong kết quả tìm kiếm, và kỹ thuật này giúp bù đắp cho bất lợi này. Sau đó, trình thu thập dữ liệu được hiển thị một trang đầy đủ nội dung mô tả nội dung của hình ảnh hoặc video do tốc độ xử lý của các bot.
Quá trình Cloaking hoạt động như thế nào?
Mục đích của kỹ thuật này là lừa dối các công cụ tìm kiếm để cải thiện xếp hạng của website trong kết quả tìm kiếm. Nó là phi đạo đức vì nội dung được hiển thị cho người dùng thường là nội dung khiêu dâm hoặc cờ bạc (chẳng hạn như sòng bạc) trong khi nội dung rất khác được hiển thị cho các robot của Google.
Nói chung, nó được thực hiện thông qua hai kỹ thuật khác nhau:
Phân phối theo tên agent: việc truy cập vào website được thực hiện thông qua một "user agent" có thể từ một người vật lý đến một bot. Vì điều này, máy chủ có thể điều chỉnh nội dung để hiển thị tùy thuộc vào loại user agent. Cloaking sau đó xảy ra khi nội dung khác nhau được phân phối dựa trên loại người dùng truy cập trang web.
Cách đây một thời gian, sử dụng plugin "User agent switcher", bạn có thể duyệt trang với user agent của Googlebot. Điều này rất hữu ích để kiểm tra xem có sự khác biệt giữa nội dung được hiển thị cho người dùng hay cho các bot hay không.

Phân phối theo IP: Khi việc phân phối nội dung của website tính đến địa chỉ IP từ đó truy vấn được thực hiện.
Kỹ thuật này được thực hiện bằng cách sửa đổi tệp .htaccess. Ví dụ, máy chủ Apache có một module gọi là "mod_rewrite" cho phép sửa đổi này.
Có nhiều kỹ thuật Cloaking hơn không?
Một số kỹ thuật không hoàn toàn là Cloaking nhưng che giấu hoặc gây khó khăn cho các bot trong việc thu thập nội dung. Chúng có thể được coi là Cloaking:
-
Văn bản ẩn hoặc vô hình: Nó được sử dụng để bao gồm nhiều từ khóa và thông tin bổ sung được ẩn khỏi người dùng. Thông tin này được "che đậy" bằng cùng màu với màu nền của trang.
-
Website Flash: Như bạn biết, việc sử dụng flash không được khuyến nghị trong các hướng dẫn khuyến nghị SEO. Các công cụ tìm kiếm không thể đọc nội dung và do đó xếp hạng nó.
-
E-mail: Nó xảy ra khi cả tên lẫn địa chỉ email của người gửi đều không được chỉ định và do đó không biết ai đang gửi email.
-
Website có nhiều HTML: SEO tốt khuyến nghị tỷ lệ html/text cao giúp xếp hạng các trang trong công cụ tìm kiếm. Nhưng nếu không phải vậy, sẽ có ít văn bản và tỷ lệ sẽ thấp. Để chống lại điều này và tránh phải thiết kế lại, kỹ thuật cloaking đã được sử dụng.
-
Thư viện hình ảnh: Để bù đắp cho hình ảnh, các webmaster đã bao gồm các từ khóa giúp xếp hạng.
-
Định vị địa lý: Nó bao gồm việc hiển thị các trang khác nhau tùy thuộc vào vị trí. Đây là một chiến thuật hiện tại vì nhiều website làm điều đó bằng cách hiển thị nội dung khác nhau tùy thuộc vào quốc gia, ví dụ. Nhưng nó trở thành một kỹ thuật ác ý nếu nội dung khác nhau được hiển thị tùy thuộc vào người dùng hoặc bot.
-
Với CSS và JavaScript: Vì Google không thể diễn giải JavaScript, các từ khóa và liên kết có thể được đưa vào website. Thông qua một hàm, nó có thể được lập trình để chúng không làm xáo trộn việc điều hướng của người dùng và chỉ nổi bật về tầm quan trọng với các tiêu đề H cho Google.
-
Chuyển hướng: Thông qua chuyển hướng, họ gửi người dùng nhấp vào kết quả tìm kiếm đến một website khác. Điều này có thể được kiểm tra dễ dàng với plugin "Redirect path". Hiện tại, đây là một kỹ thuật spam vẫn được sử dụng để lừa dối và cung cấp nội dung gây tranh cãi.
-
Kỹ thuật gần đây nhất có thể được xem xét sau sự phát triển của SPAs (Single Page Applications) vì các trang này được phát triển bằng JavaScript và độ khó kết xuất mà điều này kéo theo cho Google có thể được công cụ tìm kiếm diễn giải như một nỗ lực lừa dối. Với plugin "Lighthouse" chúng ta có thể quan sát quá trình kết xuất của một website trong console và thấy cách trình duyệt có thể xử lý trang web, cũng như tạo ra một báo cáo đầy đủ với các khuyến nghị cải tiến và cơ hội.


Triển vọng Cloaking năm 2020
Thực hành này đã lỗi thời và bạn có thể bị Google phạt nặng nếu bạn sử dụng nó ngày nay. Mặc dù cách đây nhiều năm bạn có thể lừa dối công cụ tìm kiếm, ngày nay điều đó gần như không thể do tất cả các bản cập nhật thuật toán làm cho Google trở thành một công cụ tìm kiếm tự nhiên và đạo đức hơn, tập trung vào người dùng và cung cấp các kết quả tìm kiếm chất lượng tập trung vào ý định tìm kiếm.
Các thực hành Black Hat SEO bị truy đuổi và phạt bởi đội webspam chịu trách nhiệm phạt các trang web sử dụng chúng, thậm chí đến mức làm cho cả một website biến mất khỏi kết quả tìm kiếm. Do đó, kỹ thuật này có kết quả hoàn toàn phù du.
Nguồn tham khảo:
-
Cyberclick:* "What is Cloaking?"*
-
Luis Villanueva: "What is Cloaking?"
-
Ionos: "What is Cloaking and why should you avoid it?"
-
We live security: "What is Cloaking?"
-
Iebschool: "What is concealment or Cloaking SEO?"
-
Sistrix: "What is Cloaking?"
-
Catchupdates: "What is Cloaking in SEO & Should You Do Cloaking?"
-
Search Engine Journal: "What is Cloaking & Is All Cloaking Evil?"
Tác giả: David Kaufmann

Tôi đã dành hơn 10 năm qua hoàn toàn đắm chìm trong SEO — và thành thật mà nói, tôi không muốn điều gì khác thay thế.
Sự nghiệp của tôi bước sang một tầm cao mới khi tôi làm việc với vai trò chuyên gia SEO cấp cao tại Chess.com — một trong 100 website được truy cập nhiều nhất trên toàn bộ internet. Vận hành ở quy mô đó, trên hàng triệu trang, hàng chục ngôn ngữ và trong một trong những SERPs cạnh tranh khốc liệt nhất, đã dạy tôi những điều mà không khóa học hay chứng chỉ nào có thể mang lại. Trải nghiệm đó đã thay đổi cách tôi nhìn nhận về SEO thực sự xuất sắc — và trở thành nền tảng cho mọi thứ tôi xây dựng từ đó đến nay.
Từ kinh nghiệm ấy, tôi đã sáng lập SEO Alive — một agency dành cho những thương hiệu thực sự nghiêm túc với tăng trưởng organic. Chúng tôi không ở đây để bán dashboards và báo cáo hàng tháng. Chúng tôi ở đây để xây dựng những chiến lược thực sự tạo ra chuyển biến, kết hợp tinh hoa của SEO truyền thống với thế giới mới đầy thú vị của Generative Engine Optimization (GEO) — đảm bảo thương hiệu của bạn không chỉ xuất hiện trong các liên kết xanh của Google, mà còn hiện diện ngay trong những câu trả lời do AI tạo ra mà ChatGPT, Perplexity và Google AI Overviews đang cung cấp cho hàng triệu người mỗi ngày.
Và bởi vì tôi không thể tìm được một công cụ xử lý tốt cả hai thế giới đó, tôi đã tự xây dựng một công cụ — SEOcrawl, một nền tảng SEO intelligence cấp doanh nghiệp tích hợp rankings, kiểm tra kỹ thuật, giám sát backlinks, tình trạng crawl và theo dõi hiển thị thương hiệu trên AI, tất cả trong một nơi. Đó chính là nền tảng mà tôi luôn ước có.
Khám phá thêm nội dung của tác giả này

