Thẻ noindex là gì và nó hoạt động như thế nào?

Thẻ noindex là gì và nó hoạt động như thế nào?
David Kaufmann
Hướng dẫn SEO
7 min read

Noindex là một trong những thẻ meta SEO quan trọng nhất. Nếu bạn vẫn chưa hiểu rõ nó là gì hoặc nó hoạt động như thế nào, bạn thật may mắn — hôm nay chúng tôi sẽ hướng dẫn bạn thẻ noindex là gì và nó có ích gì trong SEO.

Hãy cùng đi sâu vào.

Thẻ meta noindex là gì?

Thẻ meta noindex là một thẻ HTML được đặt trong head của một trang web để cho các công cụ tìm kiếm biết rằng trang mà chúng đang crawl không nên được lập chỉ mục. Nói cách khác, thẻ vẫn cho phép crawl một trang nhưng chặn việc lập chỉ mục của nó.

Tại sao nó quan trọng đối với SEO?

Như chúng ta vừa đề cập, thẻ meta này cho phép bạn kiểm soát việc lập chỉ mục, mà như bạn biết, là một trong những trụ cột của SEO.

Trong thế giới SEO, nó chủ yếu được sử dụng để ngăn Google "lưu trữ" các trang thin content trên trang web của bạn, chẳng hạn như:

  • Trang có nội dung trùng lặp
  • Danh mục mỏng hoặc trang có rất ít nội dung
  • Kết quả tìm kiếm nội bộ
  • Bộ lọc hoặc kết hợp các bộ lọc

Với chỉ thị này, các bot vẫn có thể crawl và phân tích mọi liên kết chúng tìm thấy trên những trang đó, nhưng không lập chỉ mục chúng.

Bạn thêm noindex vào một trang như thế nào?

Tin tốt cho tất cả những ai ghét xử lý code:

<meta name="robots" content="noindex">

Đó là vậy thôi sao? Vâng, đó là tất cả theo nghĩa đen. Bạn chỉ cần thả đoạn mã đó vào bên trong <head> của trang và, lần tiếp theo Google ghé thăm, nó sẽ nhận ra rằng trang không nên được lập chỉ mục.

Trong trường hợp bạn không muốn tin lời chúng tôi, đây là tài liệu chính thức của Google về chủ đề này.

Cũng đáng lưu ý rằng thẻ meta này có thể nhắm mục tiêu bất kỳ bot nào — chỉ cần sử dụng tên của bot thay vì thuộc tính chung robots (như trong ví dụ trên). Ví dụ, nếu bạn muốn quy tắc chỉ áp dụng cho Googlebot, bạn sẽ viết:

<meta name="googlebot" content="noindex">

Bạn có thể thêm bao nhiêu thẻ meta noindex tùy bạn, miễn là chúng không mâu thuẫn với nhau.

"Nhưng tôi đang dùng WordPress và tôi không biết cách thêm code đó…" Đừng lo, chúng tôi đã có giải pháp cho bạn.

Bạn đặt một trang thành noindex trong WordPress như thế nào?

Bên trong WordPress, nó hầu như còn đơn giản hơn. Chỉ cần mở trang bạn muốn noindex và bật toggle từ phần SEO.

Cách đánh dấu một trang là noindex trong WordPress
Cách đánh dấu một trang là noindex trong WordPress

Trong trường hợp của chúng tôi, chúng tôi sử dụng Rank Math (một trong những plugin SEO tốt nhất), vì vậy bên trong trang bạn sẽ đi đến Rank Math SEO > Advanced > No Index.

Nếu bạn sử dụng Yoast, cũng là một trong những plugin phổ biến nhất, bên trong trang bạn sẽ đi đến Yoast SEO > Advanced (biểu tượng bánh răng) > No (trên dropdown "Allow search engines to show this Page in search results?").

Bạn cũng có thể áp dụng những thay đổi này hàng loạt từ cài đặt SEO của mỗi plugin. Đối với Rank Math, đi đến Rank Math > Titles & Meta > Content types (chọn loại bạn muốn) > Post Meta Robots > Custom > Noindex.

Noindex theo loại nội dung trong Rank Math
Noindex theo loại nội dung trong Rank Math

Đối với Yoast, đi đến SEO > Search Appearance > Content types > Show (loại nội dung) in search results? > No.

Noindex theo loại nội dung trong Yoast
Noindex theo loại nội dung trong Yoast

Các loại noindex

Trong thẻ meta noindex, có các cấu hình khác nhau bạn có thể chọn tùy thuộc vào những gì bạn đang cố gắng đạt được.

noindex, follow

Đây là một trong những thiết lập phổ biến nhất trong SEO. Với cấu hình này, bạn đang cho các bot biết qua noindex rằng chúng không nên hiển thị trang đó trong kết quả tìm kiếm, và qua follow rằng chúng nên vẫn crawl mọi liên kết trên trang.

Đoạn mã để triển khai nó là:

<meta name="robots" content="noindex, follow">

Nhắc nhở: nếu bạn đang dùng WordPress, bạn có thể quản lý điều này dễ dàng từ cài đặt trang hoặc cài đặt toàn cầu của plugin.

noindex, nofollow

Thiết lập này không phổ biến như vậy, nhưng nó có sẵn. Ở đây bạn đang cho các bot biết không lập chỉ mục trang với noindex, và — đây là nơi nó khác với tùy chọn trước — với nofollow bạn đang ra lệnh cho bot không crawl các liên kết trên trang nó đang ở.

Đoạn mã để triển khai nó là:

<meta name="robots" content="noindex, nofollow">

Lỗi phổ biến

Để kết thúc, hãy xem qua một số lỗi điển hình mà mọi người gặp phải với thẻ meta noindex để bạn không vấp ngã ở nơi mà hầu hết mọi người vấp ngã.

URL đã gửi chứa thẻ "noindex"

Đây là một lỗi rất phổ biến được báo cáo trong Google Search Console.

Nó xảy ra khi các URL với thẻ meta noindex đang được gửi đến Google qua sitemap.

Nói cách khác, một mặt bạn đang gửi cho Google một URL trong sitemap để được lập chỉ mục nhanh hơn và, mặt khác, bạn đang nói với nó không lập chỉ mục cùng URL đó. Điều đó không thực sự cộng lại, phải không?

Cách khắc phục:

  • Hoặc loại bỏ những URL đó khỏi sitemap, hoặc
  • Loại bỏ thẻ noindex khỏi những URL đó.

Quyết định đúng phụ thuộc vào những gì bạn muốn các trang đó làm.

Môi trường staging / pre-production

Bạn đã từng thiết kế lại trang web của mình chưa? Có thể bạn đã phải tạo một "bản sao" của trang web của mình trên một domain khác, hoặc thậm chí bên trong cùng một domain (cổ điển domain.com/new).

Nhưng điều gì xảy ra nếu trang web đó mở cho công chúng? Hoặc điều gì xảy ra nếu Google vô tình tìm thấy nó?

Kết quả có khả năng xảy ra nhất là Google bắt đầu lập chỉ mục mọi thứ, và trong thời gian ngắn, bạn sẽ có trang web mới của mình được lập chỉ mục và trùng lặp.

Làm thế nào chúng ta khắc phục điều đó?

Dễ thôi. Khuyến nghị đầu tiên của chúng tôi là bảo vệ môi trường thử nghiệm của bạn bằng mật khẩu. Nếu bạn không muốn, bạn luôn có thể đặt trang web thành noindex và chặn nó qua robots.txt. Sự kết hợp đó là một mạng an toàn tốt chống lại các thảm họa.

Kết luận

Như bạn có thể thấy, thẻ meta noindex có rất nhiều thứ để cung cấp.

Vì đó là một chỉ thị, Google sẽ tôn trọng nó và sẽ không lập chỉ mục trang, nhưng nó vẫn sẽ crawl nó. Vì lý do đó, chúng tôi khuyên sử dụng nó cho các trường hợp chúng tôi đã đề cập nhưng không phải như một cách để tiết kiệm crawl budget.

Nếu bạn có bất kỳ câu hỏi nào, hãy để lại trong phần bình luận :)

Tác giả: David Kaufmann

David Kaufmann

Tôi đã dành hơn 10 năm qua hoàn toàn đắm chìm trong SEO — và thành thật mà nói, tôi không muốn điều gì khác thay thế.

Sự nghiệp của tôi bước sang một tầm cao mới khi tôi làm việc với vai trò chuyên gia SEO cấp cao tại Chess.com — một trong 100 website được truy cập nhiều nhất trên toàn bộ internet. Vận hành ở quy mô đó, trên hàng triệu trang, hàng chục ngôn ngữ và trong một trong những SERPs cạnh tranh khốc liệt nhất, đã dạy tôi những điều mà không khóa học hay chứng chỉ nào có thể mang lại. Trải nghiệm đó đã thay đổi cách tôi nhìn nhận về SEO thực sự xuất sắc — và trở thành nền tảng cho mọi thứ tôi xây dựng từ đó đến nay.

Từ kinh nghiệm ấy, tôi đã sáng lập SEO Alive — một agency dành cho những thương hiệu thực sự nghiêm túc với tăng trưởng organic. Chúng tôi không ở đây để bán dashboards và báo cáo hàng tháng. Chúng tôi ở đây để xây dựng những chiến lược thực sự tạo ra chuyển biến, kết hợp tinh hoa của SEO truyền thống với thế giới mới đầy thú vị của Generative Engine Optimization (GEO) — đảm bảo thương hiệu của bạn không chỉ xuất hiện trong các liên kết xanh của Google, mà còn hiện diện ngay trong những câu trả lời do AI tạo ra mà ChatGPT, Perplexity và Google AI Overviews đang cung cấp cho hàng triệu người mỗi ngày.

Và bởi vì tôi không thể tìm được một công cụ xử lý tốt cả hai thế giới đó, tôi đã tự xây dựng một công cụ — SEOcrawl, một nền tảng SEO intelligence cấp doanh nghiệp tích hợp rankings, kiểm tra kỹ thuật, giám sát backlinks, tình trạng crawl và theo dõi hiển thị thương hiệu trên AI, tất cả trong một nơi. Đó chính là nền tảng mà tôi luôn ước có.

→ Đọc tất cả bài viết của David
Thêm bài viết của David Kaufmann

Khám phá thêm nội dung của tác giả này