Sitemap: Là gì và cách tạo sitemap chuẩn SEO

Sitemap: Là gì và cách tạo sitemap chuẩn SEO
David Kaufmann
Hướng dẫn SEO
17 min read

Sitemap là một trong những yếu tố SEO bị bỏ qua phổ biến nhất bởi hầu hết các chuyên gia tư vấn SEO. Nhiều blogger gắn nhãn chúng là "không cần thiết," nhưng khi Google thường xuyên cập nhật thông tin về chúng, chúng ta ít nhất phải ghi nhớ chúng và tối ưu hóa.

Như chúng tôi nói, không phải là một yếu tố mà nếu không có nó thì trang web không thể được crawl, lập chỉ mục, phân loại, v.v., nhưng nó có thể giúp chúng ta giữ mọi thứ có tổ chức hơn nhiều. Một cách để biết liệu một trang web có đang thực hiện chiến lược SEO hay không, hay đúng hơn là một chiến lược SEO tốt, là nhìn vào sitemap của nó. Với phân tích nhỏ đó, hãy tin tôi, bạn có thể nói ai đứng đằng sau nó.

Nhưng, chúng ta có biết Sitemap là gì không? Hãy cùng xem lại dưới đây khái niệm sitemap, các loại có sẵn, chức năng, mục đích, tầm quan trọng, quy trình tạo bản đồ chính nó, lợi thế và mẹo về một công cụ như vậy bắt buộc đối với bất kỳ trang web nào, đặc biệt khi nó rất lớn về mặt trang và phức tạp liên quan đến cấu trúc URL.

Sitemap là gì

Định nghĩa của sitemap có thể thay đổi theo các loại hiện có và chức năng cũng như mục đích của chúng. Tuy nhiên, nói chung có thể nói rằng sitemap là một kế hoạch tổ chức của một trang web, liên quan đến các URL và trang nội bộ của nó, cũng như các phần và dữ liệu được lưu trữ nội bộ.

Để đơn giản hóa định nghĩa trên, có thể nói rằng đó là chỉ mục của trang web. Để đưa ra một sự tương tự đơn giản hơn, nó có thể được so sánh với chỉ mục chúng ta tìm thấy khi mở một cuốn sách. Có cần thiết phải đọc cuốn sách không? Không, nhưng nếu chúng ta thấy rằng chỉ mục được viết kém, với các trang không tồn tại, không theo thứ tự, v.v., ấn tượng đầu tiên của chúng ta sẽ là gì? Làm thế nào chúng ta có thể nhanh chóng và thuận tiện truy cập một phần cụ thể của cuốn sách? Với một số khác biệt, sitemap rất giống nó.

Khái niệm trên có giá trị cho sitemap nói chung, thay đổi theo loại sitemap đang được thảo luận hoặc mà một nền tảng có, vì có thể có một số, mà chúng ta sẽ giải quyết trong phần tương ứng của nó. Sitemap cũng là một biểu diễn đồ họa của một trang web và cách nó được tổ chức, đồng thời được bao gồm trên nền tảng để cải thiện điều hướng và dễ sử dụng của người dùng.

Do đó, sitemap liên quan đến khái niệm của chúng một bản chất tổ chức, kỹ thuật và sử dụng, tạo điều kiện thuận lợi cho việc truy cập nền tảng, cả cho người dùng và công cụ tìm kiếm, và chúng cũng là một công cụ phát triển web quan trọng.

Ví dụ sitemap
Ví dụ sitemap

Chức năng của Sitemap

Ngày nay, một trang web có sitemap là một lợi thế, đặc biệt khi nền tảng trở nên phức tạp, với một số lượng lớn các địa chỉ web và các phần được bao gồm, biến nó thành một công cụ quan trọng vì lý do kỹ thuật, dễ sử dụng, ý định tổ chức, và cả cho việc tạo ra lưu lượng truy cập.

Sitemap giúp hiểu một trang web và cấu trúc của nó, dù đó là một dự án đơn giản, với một trang chủ, liên hệ, các phần, hay các nền tảng rất phức tạp như các trang thương mại điện tử với hàng triệu sản phẩm, các phần phụ, blog, tags, v.v.

Chúng ta đã thấy ý nghĩa tổ chức của yếu tố này, nhưng nó có giá trị nhiều hơn nữa với tư cách là một yếu tố SEO. Cung cấp cho Google cấu trúc rõ ràng của trang web của chúng ta, ưu tiên các URL quan trọng nhất, giảm những URL chúng ta không quan tâm, v.v., giúp Google "hiểu" theo cách nhanh hơn và rõ ràng hơn, và do đó giúp ích rất nhiều cho việc lập chỉ mục trang web.

Lợi ích SEO của việc có một Sitemap được triển khai tốt

Tập trung hơn vào các khía cạnh thuần SEO, hãy xem như một bản tóm tắt các lợi ích chính của việc có một sitemap được cập nhật và tối ưu hóa:

  • Cải thiện lập chỉ mục trang web, như chúng tôi đã đề cập trước đó. Cung cấp cho Google thứ tự và tầm quan trọng của các URL của chúng ta sẽ giúp lập chỉ mục tốt hơn.

  • Giúp chúng ta phát hiện lỗi nhanh chóng. Khi một sitemap đã được tạo, nên tải nó lên gốc của trang web của bạn và thông báo cho Google qua Search Console. Google sẽ crawl sitemap đó, thông báo cho bạn nếu nó tìm thấy bất kỳ vấn đề nào trong bất kỳ URL nào được liệt kê, để chúng ta có thể thấy cách Google hiểu các URL đó và cải thiện những URL cần thiết.

  • Tổ chức trang web. Trong trang web của chúng ta, ví dụ, các sản phẩm sẽ không có cùng tầm quan trọng như các bài viết blog, chính sách bảo mật, v.v. Tạo sitemap là một cách rất tốt để thực hiện tự phân tích và ưu tiên các mục tiêu SEO của chúng ta dựa trên những gì được phản ánh trong đó.

  • Đó là một cách buộc chúng ta liên tục xem xét trạng thái của trang web. Sitemap nên là một yếu tố sống động. Điều này có nghĩa là chúng ta sẽ phải làm sạch nó liên tục, vì có nó được tối ưu hóa kém không chỉ không giúp ích mà còn có thể gây hại. Bằng cách này, chúng ta đang "buộc" mình có quyền kiểm soát lớn hơn đối với trang web của chúng ta.

Sitemap nên trông như thế nào

Dưới đây, chúng ta sẽ xem một số điểm cơ bản bạn nên ghi nhớ khi tạo sitemap:

  • Không thêm URL vào sitemap với mã phản hồi (status code) khác 200.

  • Không thêm URL bị chặn trong robots.txt vào sitemap.

  • Không thêm URL có thẻ noindex vào sitemap.

  • Không thêm URL không phải canonical vào sitemap (tức là, hãy không thêm các URL được canonical hóa thành URL khác; vì điều này, chúng ta sẽ trực tiếp sử dụng URL gốc).

  • Tránh thêm các trang không có giá trị SEO vào sitemap (ở đây ý thức chung chiếm ưu thế; nếu chúng ta thấy rằng có một nhóm lớn, ví dụ, các trang không có giá trị SEO như PDFs, có thể nên không bao gồm chúng).

Lỗi Sitemap điển hình

Nhiều khi, do bỏ sót hoặc các yếu tố bên ngoài, chúng ta gặp phải nhiều lỗi trong sitemap. May mắn thay, chúng ta có Search Console sẵn có, cảnh báo chúng ta về tất cả các lỗi được phát hiện và cho phép chúng ta hành động để sửa mọi thứ.

Lỗi Sitemap
Lỗi Sitemap

Dưới đây, bạn có thể xem các lỗi phổ biến nhất chúng ta thường tìm thấy:

  • "URL đã gửi chứa thẻ noindex": nếu chúng ta gửi một URL trong sitemap có thẻ noindex, chúng ta đang đưa ra các tín hiệu khó hiểu cho công cụ tìm kiếm. Một mặt chúng ta nói với nó không lập chỉ mục, và mặt khác chúng ta lại làm. Đó là lý do tại sao quan trọng phải duy trì tính nhất quán.

  • "Sitemap bao gồm các URL mà tệp robots.txt đã chặn": theo cách tương tự với noindex, nếu chúng ta chặn một trang hoặc một mẫu trang qua robots.txt và sau đó gửi nó trong sitemap, chúng ta sẽ lại làm bối rối các công cụ tìm kiếm và trên hết là lãng phí crawl budget.

Các loại Sitemap được sử dụng nhiều nhất

Mặc dù sitemap XML là phổ biến nhất và liên quan nhất, sự thật là nó không phải là loại duy nhất tồn tại, và có một số loại có sẵn với các chức năng và phương pháp tiếp cận khác nhau. Đó là:

  • Sitemap XML: sitemap XML được thiết kế đặc biệt để tạo điều kiện thuận lợi cho việc lập chỉ mục các URL của một trang web, cho công cụ thấy rằng chúng có sẵn ở đó để được crawl và bao gồm trong kết quả tìm kiếm. Loại sitemap này là cần thiết cho các trang web lớn sẽ gặp vấn đề về crawling.

  • Sitemap HTML: loại sitemap này hiển thị thứ tự phân cấp của nền tảng, với các phần từ danh mục đầu tiên hoặc trang chính, đến cấp độ thứ hai và thứ ba với các phần và phần phụ. Loại sitemap này có sẵn cho người dùng và thực sự tạo điều kiện thuận lợi cho trải nghiệm duyệt web của họ.

  • Sitemap ROR: sitemap ROR có thể được coi là một biến thể của XML, nhưng có bản chất mạnh mẽ hơn nhiều, vì nó có mô tả về URL, các phần, trong số những thứ khác, và hỗ trợ nhiều định dạng, lý tưởng cho các trang web với các trang sản phẩm và dịch vụ.

  • Sitemap Video: khi một trang web có nội dung đa phương tiện rộng rãi, nên bao gồm sitemap video bao gồm tất cả URL với loại tệp này, bao gồm tên, hình thu nhỏ, mô tả và liên kết đến các landing page. Nó được thực hiện để tạo điều kiện thuận lợi cho việc crawl của công cụ tìm kiếm và tìm các tệp ở định dạng .mpg, avi, mkv, trong số những định dạng khác.

  • Sitemap News: sitemap tin tức nhằm mục đích tạo ra một sơ đồ tổ chức cho phép các nhà phát triển xử lý tin tức và thông tin được đặt trên các nền tảng như Google News, cung cấp thông tin về địa điểm, tên và nội dung của tin tức và thậm chí cả từ khóa.

  • Sitemap Image: một sitemap dành riêng cho hình ảnh và nội dung của chúng. Rất thú vị khi sử dụng nó trong các cổng thông tin nơi hình ảnh có trọng lượng quan trọng, chẳng hạn như một trang thương mại điện tử của các sản phẩm trực quan. Bằng cách này, chúng ta ưu tiên xuất hiện trong kết quả tìm kiếm của Google Images.

Khi nào sử dụng Sitemap

Thường được khuyến nghị bất kỳ trang web nào cũng có một sitemap liên quan vì lợi ích của nó, nhưng liên quan đến các đặc điểm cụ thể, sử dụng nó trên một nền tảng trở nên gần như bắt buộc, đó là:

  • Khi một trang web rất lớn: khi một nền tảng rất rộng theo các phần và URL, sitemap là cần thiết vì nó sẽ tạo điều kiện thuận lợi cho điều hướng và cũng cho việc crawl của mỗi trang, có thể phức tạp khi có nhiều trang cho các crawler hoặc spider của các công cụ tìm kiếm như Google.

  • Khi một trang web mới: khi một trang web mới, nên có một sitemap, vì khi nó ở giai đoạn ban đầu, nó sẽ không có liên kết kết nối với nó, cản trở việc crawling. Vì vậy, sitemap sẽ làm cho mọi thứ dễ dàng hơn cho Google và các công cụ tìm kiếm khác.

  • Khi có một số lượng lớn các URL bị cô lập: liên quan đến lý do trước đó, nên thêm sitemap khi một trang web có một tệp với nhiều địa chỉ bị cô lập hoặc không kết nối với những địa chỉ khác, vì nó làm cho việc crawl dễ dàng hơn cho các bot công cụ tìm kiếm.

Tạo Sitemap trong WordPress

Đối với hầu hết mọi người khi nhìn thấy một sitemap trong một hình ảnh, có vẻ rất phức tạp do tất cả các kết nối và phân cấp mà nó có, ngoài kiến thức phát triển web cần thiết. May mắn thay, có những cách đơn giản hơn để tạo sitemap, thông qua CMS (Content Management System).

WordPress chắc chắn là CMS được sử dụng nhiều nhất trên toàn thế giới để quản lý và tạo các trang web, và nó cung cấp một công cụ thông qua một plugin cho phép tạo sitemap tự động. Plugin đó là từ Rank Math (mặc dù có nhiều plugin khác trên thị trường cho WordPress như Yoast SEO tạo yếu tố này cho bạn. Trong trường hợp này, chúng tôi đặt tên Rank Math là một trong những plugin được biết đến nhiều nhất và hoàn toàn miễn phí. Sau khi có nó trong WordPress, các bước sau để tạo sitemap là:

  • Truy cập WordPress sử dụng thông tin xác thực và trong bảng điều khiển nhập tùy chọn "Rank Math".

  • Khi đã ở "Rank Math", một số tùy chọn liên quan đến plugin sẽ xuất hiện, nơi bạn phải chọn "Dashboard" và sau đó chọn nút kích hoạt "Sitemaps".

  • Các thay đổi được lưu và sitemap XML đã được tạo.

  • Để xem bản đồ, hãy nhấp vào liên kết xuất hiện ở đầu trang.

  • Sitemap được cập nhật tự động sau khi thêm các địa chỉ và phần mới, mà không cần làm gì khác.

Rank math sitemaps 1.jpg
Rank math sitemaps 1.jpg

Tất nhiên, thông qua WordPress và plugin Rank Math không phải là cách duy nhất để tạo sitemap, vì mỗi CMS có công cụ riêng để làm điều đó. Ví dụ, các trang thương mại điện tử dựa trên Shopify có lợi thế là chính nền tảng tạo sitemap XML, bao gồm các sản phẩm và địa chỉ, bài đăng, hình ảnh, bộ sưu tập, trong số những thứ khác, là không thể thiếu cho loại trang này.

Theo cùng cách, có sẵn trực tuyến các công cụ khác nhau để tạo sitemap độc lập với loại XML, là loại phổ biến nhất, chẳng hạn như XML Sitemaps và SEOptimer Sitemap Generator.

XML Sitemaps

Tạo sitemap với XML Sitemaps đơn giản, vì quy trình hoàn toàn tự động. Để bắt đầu, hãy truy cập trang web với trình duyệt ưa thích của bạn và trong thanh chèn URL của trang web để tạo sitemap.

Bằng cách nhấp vào "Start" nền tảng sẽ crawl toàn bộ trang web và tạo tệp .xml để tải xuống. Nếu trang web rất lớn và có hơn 500 URL nội bộ, phải sử dụng phiên bản trả phí, vì vậy đó là một công cụ lý tưởng cho các trang web nhỏ.

SEOptimer Sitemap Generator

SEOptimer Sitemap Generator là một công cụ hữu ích khác để tạo sitemap, chỉ cần nhập URL của nền tảng và một số thông tin bổ sung như tần suất trang web thay đổi, số lượng URL gần đúng, ngày sửa đổi cuối cùng, trong số những thứ khác.

Khi bạn nhập trang web và nhập tất cả thông tin được đề cập ở trên, nền tảng sẽ tạo một tệp .xml có thể được tải xuống và hiển thị sitemap với các địa chỉ. Chúng tôi nhắc bạn rằng HẾT SỨC khuyến nghị, một khi bạn có tệp sitemap trong tay được tạo bởi bất kỳ công cụ nào, đăng ký nó trong Google Search Console, vì nó sẽ tạo điều kiện thuận lợi cho việc đọc nó bởi Google.

Hạn chế của Sitemap

Khi tạo sitemap, có một loạt hạn chế mà chúng ta phải lưu ý để không thực hiện chúng không chính xác:

  • Tất cả URL chứa trong một sitemap phải thuộc cùng một tên miền. Chúng ta không thể thêm các tên miền phụ trong một sitemap; vì điều đó chúng ta phải tạo một cái riêng.

  • Tệp sitemap phải có mã hóa UTF-8 được triển khai.

  • Tối đa chúng ta có thể bao gồm 50.000 URL trong một sitemap.

  • Trọng lượng tối đa cho yếu tố này là 50 MB.

Sitemap Index

Khi chúng ta gặp bất kỳ tình huống nào được đề cập ở trên giới hạn dự án của chúng ta, Google cung cấp cho chúng ta sitemap indexes. Nghĩa là, chúng ta có thể tạo một tập hợp các sitemap khác nhau và liên hệ tất cả chúng thông qua chỉ mục đó. Chúng ta có thể nói đó là một sitemap của các sitemap. Đây chúng tôi để lại cho bạn thông tin chính thức của Google về vấn đề này.

Sitemap index
Sitemap index

LƯU Ý: Như bạn đã có thể thấy trong trường hợp ban đầu, một trong những khách hàng của chúng tôi (Chess.com) đã áp dụng nó và sự thật là nó hoạt động rất tốt. Tất cả sitemap được phân loại theo danh mục và sau đó theo ngôn ngữ để thực hiện theo dõi và phân loại chính xác tất cả các trang.

Sitemap với các phiên bản theo vị trí địa lý

Nếu chúng ta có các phiên bản khác nhau của một URL cho các khu vực khác nhau, như trường hợp với trang web đa ngôn ngữ, chúng ta có thể chọn giữa việc tạo một sitemap cho mỗi ngôn ngữ hoặc sử dụng một sitemap duy nhất trong đó tất cả các bản dịch được thêm vào. Nếu bạn có nghi ngờ về quy trình, bạn luôn có thể xem hướng dẫn của Google về vấn đề này cho trường hợp cụ thể này.

sitemap đa ngôn ngữ
sitemap đa ngôn ngữ

Bonus: Một số cách sử dụng bổ sung cho Sitemap

Để kết thúc, chúng tôi để lại cho bạn một số cách sử dụng "đặc biệt" cho sitemap mà bạn có thể thấy hữu ích:

  • Tăng tốc việc hủy lập chỉ mục các trang. Vâng, như bạn nghe, chúng ta có thể tạm thời tạo một sitemap với tất cả các URL chúng ta muốn hủy lập chỉ mục, thêm thuộc tính nofollow, noindex vào chúng và tải lên Search Console. Bằng cách này, chúng ta sẽ buộc Google crawl chúng sớm hơn và do đó đọc noindex, vì vậy chúng ta sẽ tăng tốc việc hủy lập chỉ mục các URL đó.

  • Tăng tốc việc loại bỏ các trang. Theo cùng dòng với điểm trước đó, nhưng thêm mã trạng thái 410 (đã loại bỏ) cho các URL mà chúng ta muốn Google loại bỏ vĩnh viễn khỏi chỉ mục của nó. Bằng cách tải lên sitemap với các URL này một cách độc quyền, chúng ta cũng sẽ ưu tiên quá trình này. Đừng quên hoàn tác nó khi chúng được loại bỏ.

  • Theo dõi đối thủ cạnh tranh. Bằng cách trích xuất tất cả URL từ sitemap của họ và phát hiện ra cái nào họ ưu tiên, cái nào không, cái nào có lỗi, v.v. Vì điều này, tôi sẽ chia sẻ một công cụ chúng tôi tìm thấy trên internet dưới dạng Google Sheet rất tiện lợi:

https://docs.google.com/spreadsheets/d/1jKP30CAJEL-rQ8PUnkNfJOiBfDN1XWNauTEUxBU1-w8/copy

Bạn chỉ cần tạo bản sao và sửa đổi giá trị này với trang web bạn muốn trích xuất các URL từ sitemap của nó:

trích xuất sitemap urls
trích xuất sitemap urls

Chúng tôi hy vọng với Hướng dẫn Sitemap hoàn chỉnh này, bạn có thể tạo chúng một cách hiệu quả và được tối ưu hóa trong các dự án web của mình.

Tác giả: David Kaufmann

David Kaufmann

Tôi đã dành hơn 10 năm qua hoàn toàn đắm chìm trong SEO — và thành thật mà nói, tôi không muốn điều gì khác thay thế.

Sự nghiệp của tôi bước sang một tầm cao mới khi tôi làm việc với vai trò chuyên gia SEO cấp cao tại Chess.com — một trong 100 website được truy cập nhiều nhất trên toàn bộ internet. Vận hành ở quy mô đó, trên hàng triệu trang, hàng chục ngôn ngữ và trong một trong những SERPs cạnh tranh khốc liệt nhất, đã dạy tôi những điều mà không khóa học hay chứng chỉ nào có thể mang lại. Trải nghiệm đó đã thay đổi cách tôi nhìn nhận về SEO thực sự xuất sắc — và trở thành nền tảng cho mọi thứ tôi xây dựng từ đó đến nay.

Từ kinh nghiệm ấy, tôi đã sáng lập SEO Alive — một agency dành cho những thương hiệu thực sự nghiêm túc với tăng trưởng organic. Chúng tôi không ở đây để bán dashboards và báo cáo hàng tháng. Chúng tôi ở đây để xây dựng những chiến lược thực sự tạo ra chuyển biến, kết hợp tinh hoa của SEO truyền thống với thế giới mới đầy thú vị của Generative Engine Optimization (GEO) — đảm bảo thương hiệu của bạn không chỉ xuất hiện trong các liên kết xanh của Google, mà còn hiện diện ngay trong những câu trả lời do AI tạo ra mà ChatGPT, Perplexity và Google AI Overviews đang cung cấp cho hàng triệu người mỗi ngày.

Và bởi vì tôi không thể tìm được một công cụ xử lý tốt cả hai thế giới đó, tôi đã tự xây dựng một công cụ — SEOcrawl, một nền tảng SEO intelligence cấp doanh nghiệp tích hợp rankings, kiểm tra kỹ thuật, giám sát backlinks, tình trạng crawl và theo dõi hiển thị thương hiệu trên AI, tất cả trong một nơi. Đó chính là nền tảng mà tôi luôn ước có.

→ Đọc tất cả bài viết của David
Thêm bài viết của David Kaufmann

Khám phá thêm nội dung của tác giả này