Thin Content: Là gì và cách khắc phục hiệu quả

Thin Content: Là gì và cách khắc phục hiệu quả
David Kaufmann
Hướng dẫn SEO
12 min read

Trong bài viết hôm nay, chúng tôi nghĩ rằng thật phù hợp để đề cập đến khái niệm "thin content" hoặc nội dung thưa/nghèo nàn vì, dựa trên kinh nghiệm của chúng tôi, chúng tôi đã có thể xác minh rằng đó là một trong những khái niệm được sử dụng rất nhiều trong ngành của chúng ta, nhưng nhiều SEO không biết chính xác nó đề cập đến điều gì, vì nó rộng hơn nhiều so với những gì mọi người nghĩ.

Khái niệm này lần đầu tiên được xem xét sau bản cập nhật Google Panda, thuật toán lớn đầu tiên của Google, vào tháng 2 năm 2011 (vào thời điểm đó, nhiều người trong chúng tôi thậm chí không biết SEO là gì).

Nếu bạn muốn biết tất cả những điều quan trọng về thin content và cách làm việc với nó bằng những gì chúng tôi cho là công cụ tốt nhất để phát hiện nó (SafeCont), chúng tôi mời bạn tiếp tục đọc bài viết mà chúng tôi đã chuẩn bị với rất nhiều nhiệt huyết dành cho các SEO trên toàn thế giới.

Thin Content là gì?

Thin content là nội dung của một trang web cung cấp ít hoặc không có giá trị cho người dùng. Khái niệm này không chỉ bao gồm các trang trống hoặc gần trống như nhiều người nghĩ.

Các loại trang được coi là Thin Content

Không có tiêu chí chính thức nào cho chúng ta biết rằng một trang có thể được đưa vào nhóm "trang vô dụng", vì tất cả các trang đều có thể (kể cả trang Home). Tuy nhiên, với kinh nghiệm, chúng tôi có thể tìm ra các mẫu hình cho phép chúng tôi xây dựng một phân loại của loại trang này.

Trang trống hoặc gần trống

Không chỉ những trang này nghèo nội dung, mà nội dung không đóng góp gì cả. Chúng ta phải nhớ rằng độ dài của nội dung không phải là chỉ số của thin content hay của chất lượng. Nếu chúng ta cung cấp cho người dùng mọi thứ họ đang tìm kiếm với ít nội dung, Google chắc chắn sẽ thưởng cho điều đó. Hầu hết những trường hợp này mà một SEO thường gặp phải liên quan đến các trang kết quả tìm kiếm nội bộ được index, các bộ lọc kém được xử lý, hoặc Tag.

Indexed SEO Tags
Indexed SEO Tags

Kết quả tìm kiếm có thể index ngẫu nhiên

Indexable SEO Tags without content
Indexable SEO Tags without content

Trang TAG có thể index không có nội dung

Để ngăn loại thin content này xảy ra, chúng ta nên cố gắng tránh làm cho các loại trang này có thể index, hoặc kiểm soát nó rất chi tiết. Chúng ta không nên tuân theo quy trình này trên các trang có thể là một giải pháp tốt cho truy vấn được người dùng thực hiện trên Google và mà chúng ta tin rằng có thể xếp hạng sau khi tối ưu hóa thích hợp.

TAGs page with SEO content
TAGs page with SEO content

Ví dụ về một trang kết quả tìm kiếm được index với nội dung phù hợp

SEO Filters
SEO Filters
Ví dụ về URL được index đúng với một bộ lọc

TAG seo page with content
TAG seo page with content

Trang TAG có thể index với nội dung liên quan.

Trong trường hợp các tag, chúng tôi cũng khuyến nghị những gì đã được đề cập trong nhiều dịp: tạo chúng rất cẩn thận và luôn theo một chiến lược SEO có ý nghĩa. Bằng cách này, chúng ta đảm bảo rằng chúng có thể được sử dụng như một phân loại phụ, giống như được thực hiện trong nhiều phương tiện truyền thông.

Trang có nội dung trùng lặp

Đây là một trong những thực tiễn được Google chống lại nhiều nhất: nếu nội dung không cung cấp thông tin liên quan và khác biệt với thông tin của đối thủ cạnh tranh, nó sẽ không được Google công nhận. Không cần phải nói, sao chép trực tiếp nội dung từ các cổng khác có nghĩa là, trong hầu hết các trường hợp, bạn sẽ bị phạt nặng bởi các công cụ tìm kiếm.

Spinning text cũng được coi là nội dung trùng lặp, nghĩa là sao chép nó và viết lại với những điều chỉnh nhỏ. Bot của Google có khả năng phát hiện đạo văn, ngay cả khi một số câu được thay đổi.

Việc dịch nội dung từ ngôn ngữ khác và đưa nó trực tiếp vào trang web của bạn cũng được coi là thin content.

Lời khuyên của chúng tôi là không đi đường tắt; nếu bạn muốn làm SEO tốt, hãy làm việc chăm chỉ với nó, tạo nội dung thú vị, và chúng tôi đảm bảo với bạn rằng kết quả sẽ đến sớm hơn là muộn.

Nội dung được tạo tự động

Trong trường hợp này, chúng ta đang đề cập đến nội dung được tạo bởi các công cụ hoặc bot. Đúng là AI đã tiến bộ rất nhiều và có thể tạo ra các văn bản tương đối thú vị, nhưng nó vẫn là một thực tiễn tiêu biểu cho black hat cơ bản nhất mà trang web của bạn cuối cùng sẽ phải trả giá.

Bot không ngu ngốc và người dùng cũng vậy. Tạo nội dung không đóng góp gì cho người dùng hiện được coi tại SEO Alive là điểm đối lập tối đa của SEO.

Đừng là con châu chấu trong câu chuyện ngụ ngôn.

Nội dung tiếp thị liên kết chất lượng thấp

Các trang web tiếp thị liên kết cung cấp lời khuyên mua hàng và đánh giá hữu ích, đầy đủ không có gì phải sợ Google. Tuy nhiên, các trang đầy liên kết tiếp thị liên kết không cung cấp thông tin hữu ích hoặc liên quan cho người dùng cuối là mục tiêu chính của một hình phạt Google.

Ôi, số lượng các trang loại này đã nhận được disavow trong các kiểm tra link building!

Để tránh loại hình phạt này, chúng ta phải đảm bảo rằng trang web có mục đích vượt ra ngoài việc cung cấp tiếp thị liên kết và cung cấp các cơ hội tiếp thị liên kết phù hợp chặt chẽ với lĩnh vực của trang web của bạn.

Doorway Pages

Chúng dễ nhận biết vì chúng được thiết kế chủ yếu cho các công cụ tìm kiếm, không phải cho con người. Kỹ thuật này, đã không còn được sử dụng, bao gồm việc tạo nhiều trang/tên miền với mục tiêu xếp hạng cho một thuật ngữ rất cụ thể hoặc một nhóm các thuật ngữ rất gần nhau, và liên kết hoặc chuyển hướng tất cả chúng đến cùng một URL.

Nội dung điển hình được sử dụng trên các trang này tương tự như sau:

doorway pages seo
doorway pages seo

Ví dụ về một doorway page.

Theo quan điểm của chúng tôi, đó là một chiến lược cổ xưa mà trong SEO hiện tại sẽ liên quan đến nhiều nỗ lực hơn là kết quả và tất nhiên là thin content.

Thin content ảnh hưởng đến trang web như thế nào?

Chúng tôi phải làm rõ rằng thin content thường bị phạt trên các trang web quá chưa được tối ưu hóa, đại diện cho một sự hỗn loạn về cấu trúc và nội dung mà ngay cả Google cũng không thể xác định, hoặc những trang web có cấu trúc đã chọn cách "dễ dàng" bằng cách sử dụng một số (hoặc nhiều) kỹ thuật black hat.

Bất lợi chính của việc tạo thin content trên một trang web là nó tự đặt mình vào nguy cơ bị Google phạt nặng, ngăn nó đạt được thứ hạng tốt trong SERPs hoặc khiến vị trí của nó giảm liên tục.

Nhưng đó không phải là bất lợi duy nhất, vì nếu một trang web cố gắng nhận được lượt truy cập từ bất kỳ kênh nào, sẽ khó giữ chân và thuyết phục người dùng tương tác. Trong tình hình SEO hiện đang ở, nơi người dùng là nhân vật chính, sự thật này sẽ dẫn đến mất uy tín ngày càng nhiều.

Cách phát hiện thin content với Safecont

Sau tất cả những gì bạn đã biết và sau khi đọc tất cả những điều này, chắc chắn bạn không muốn cho phép trang web của mình có ngay cả một chút nội dung vô dụng nào. Như chúng tôi vừa nói với bạn, nếu bạn có một chiến lược nội dung chất lượng và trang web của bạn trình bày một mức độ tối ưu hóa thích hợp, bạn không nên lo lắng, nhưng chúng tôi khuyên bạn nên kiểm soát loại trang này, đặc biệt là vì những người dùng có thể truy cập vào chúng.

Vì lý do này, chúng tôi nghĩ rằng việc nói về một trong những công cụ đang hoạt động tốt nhất cho chúng tôi tại agency của chúng tôi là rất phù hợp; chúng tôi muốn bạn biết nó trong trường hợp, giống như chúng tôi, nó có thể hữu ích cho bạn trong các kiểm tra nội dung của bạn.

Để chúng tôi cho những bạn không biết biết, Safecont là một công cụ Tây Ban Nha chuyên về phân tích nội dung và kiến trúc sử dụng công nghệ Machine Learning để phát hiện nơi các vấn đề chính của một trang web được tìm thấy. Với nó, chúng ta có thể phát hiện nội dung chất lượng thấp có thể dẫn đến các hình phạt và các vấn đề khác.

Vì chủ đề chính của bài viết là thin content, chúng tôi sẽ tập trung độc quyền vào phân tích mà công cụ thực hiện về nó. Sau khi trang web được crawl, ngay lập tức, trong bản tóm tắt crawl, chúng ta đã thấy số lượng URL trình bày vấn đề này.

Safecont dashboard
Safecont dashboard

Tổng quan về dashboard công cụ SEO Safecont.

Nếu chúng ta đi sâu vào phân tích cụ thể…

Thin Content Safecont
Thin Content Safecont

Chức năng phát hiện thin content là một trong những tính năng tốt nhất của công cụ.

Chúng ta thấy một bản tóm tắt rất trực quan và rất chính xác về tình trạng của trang web.

Safecont Cluster Analysis
Safecont Cluster Analysis

Tổng quan về phân tích cluster của SafeCont.

Điều đầu tiên sẽ thu hút sự chú ý của chúng ta, không nghi ngờ gì, là biểu đồ hình tê giác đặc biệt (logo của công cụ, vì gấu trúc sẽ quá rõ ràng) cho chúng ta thấy phần trăm rủi ro phải chịu một hình phạt.

SEO penalty risk
SEO penalty risk

Biểu đồ rủi ro hình phạt của Safecont.

Theo phân tích này, trang web đáp ứng mức độ tối ưu của thin content và, hiện tại, Google không có lý do để phạt chúng. Bên dưới phân tích này, chúng ta thấy một bảng và biểu đồ rất tò mò và đại diện cho phép chúng ta có cái nhìn tổng quan về trạng thái của trang web:

Thin Content Clusters
Thin Content Clusters

Phân tích thin content thông qua các cluster.

Bảng cho chúng ta thấy ba cột:

  • Links: cung cấp, theo khoảng 10, phần trăm thin content mà các trang có thể có.
  • Pages: số lượng trang trình bày mỗi phần trăm thin content.
  • Cluster Risk: khả năng mỗi trang trong mỗi khoảng sẽ bị phạt.

Chúng tôi biết rằng được diễn đạt như thế này có thể có vẻ hơi khó hiểu, nhưng cách diễn giải đúng sẽ là một cái gì đó như thế này: "Chúng tôi quan sát thấy rằng hầu hết các trang (706) trình bày phần trăm thin content giữa 10 và 20%, với cơ hội bị phạt trung bình là 29,81%.

Chỉ có bốn trang có phần trăm thin content lớn hơn 40% và cơ hội bị phạt là 36,98%."

Biểu đồ thể hiện điều này, phân biệt mỗi khoảng theo màu sắc, với màu xanh lá cây là khoảng có phần trăm thin content thấp nhất và màu đỏ là khoảng có phần trăm cao nhất. Đây là lý do tại sao khoảng thứ hai (10%-20%) được biểu thị với độ dày lớn nhất.

Và cuối cùng…

Safecont URL Analysis
Safecont URL Analysis

Phân tích URL riêng lẻ (thin content, rủi ro hình phạt...)

Safecont cho chúng ta thấy một phân tích cá nhân của mỗi URL cho phép chúng ta lọc theo ý muốn. Cùng với các URL, có 3 điểm dữ liệu xuất hiện:

  • ThinRatio: phần trăm các từ tương tự trong cùng một trang
  • NUMWORDS: mật độ các từ được bao gồm trong nội dung
  • PAGERISK: xác suất trang có thể bị phạt.

Như chúng tôi đã nói trong suốt bài viết, chúng ta không thể chỉ tập trung độc quyền vào độ dài của nội dung, như công cụ tập trung vào trong phần cuối cùng này. Tuy nhiên, đó là điều chúng ta phải ghi nhớ.

Công cụ này phải được hiểu một cách toàn diện, vì nó sẽ cho phép chúng ta thực hiện các kiểm tra nội dung chất lượng rất cao. Chúng tôi rất khuyến khích bạn thử nó.

** Lưu ý: Bài viết này chưa được tài trợ, nhưng chúng tôi thực sự tin rằng Safecont cung cấp giá trị và có chất lượng cao, và do đó chúng tôi cho rằng nó phù hợp để chia sẻ với cộng đồng SEO.*

Tác giả: David Kaufmann

David Kaufmann

Tôi đã dành hơn 10 năm qua hoàn toàn đắm chìm trong SEO — và thành thật mà nói, tôi không muốn điều gì khác thay thế.

Sự nghiệp của tôi bước sang một tầm cao mới khi tôi làm việc với vai trò chuyên gia SEO cấp cao tại Chess.com — một trong 100 website được truy cập nhiều nhất trên toàn bộ internet. Vận hành ở quy mô đó, trên hàng triệu trang, hàng chục ngôn ngữ và trong một trong những SERPs cạnh tranh khốc liệt nhất, đã dạy tôi những điều mà không khóa học hay chứng chỉ nào có thể mang lại. Trải nghiệm đó đã thay đổi cách tôi nhìn nhận về SEO thực sự xuất sắc — và trở thành nền tảng cho mọi thứ tôi xây dựng từ đó đến nay.

Từ kinh nghiệm ấy, tôi đã sáng lập SEO Alive — một agency dành cho những thương hiệu thực sự nghiêm túc với tăng trưởng organic. Chúng tôi không ở đây để bán dashboards và báo cáo hàng tháng. Chúng tôi ở đây để xây dựng những chiến lược thực sự tạo ra chuyển biến, kết hợp tinh hoa của SEO truyền thống với thế giới mới đầy thú vị của Generative Engine Optimization (GEO) — đảm bảo thương hiệu của bạn không chỉ xuất hiện trong các liên kết xanh của Google, mà còn hiện diện ngay trong những câu trả lời do AI tạo ra mà ChatGPT, Perplexity và Google AI Overviews đang cung cấp cho hàng triệu người mỗi ngày.

Và bởi vì tôi không thể tìm được một công cụ xử lý tốt cả hai thế giới đó, tôi đã tự xây dựng một công cụ — SEOcrawl, một nền tảng SEO intelligence cấp doanh nghiệp tích hợp rankings, kiểm tra kỹ thuật, giám sát backlinks, tình trạng crawl và theo dõi hiển thị thương hiệu trên AI, tất cả trong một nơi. Đó chính là nền tảng mà tôi luôn ước có.

→ Đọc tất cả bài viết của David
Thêm bài viết của David Kaufmann

Khám phá thêm nội dung của tác giả này