Top 9 vấn đề SEO phổ biến và cách tránh hoặc khắc phục

Top 9 vấn đề SEO phổ biến và cách tránh hoặc khắc phục
Ognian Mikov
Hướng dẫn SEO
19 min read

SEO là một lĩnh vực phức tạp đòi hỏi xem xét cẩn thận nhiều yếu tố và quy trình để được triển khai chính xác. Có nhiều cách khác nhau mà chúng ta có thể mắc sai lầm và làm tổn hại đến tiềm năng tự nhiên của một website.

Trong bài viết này, chúng ta sẽ đề cập đến những vấn đề SEO phổ biến nhất và cách tránh trở thành nạn nhân của chúng. Tương tự, nếu bạn đã đang phải vật lộn với những vấn đề như vậy, chúng tôi có thể giúp bạn khắc phục chúng thành công.

Đầu tiên, hãy bắt đầu với những điều cơ bản.

Vấn đề SEO là gì?

Một vấn đề SEO tiềm ẩn có thể làm tổn hại đến hiệu suất của website của chúng ta trên các công cụ tìm kiếm, có thể được xác định là một vấn đề. Để đảm bảo việc tối ưu hóa đầy đủ các trang xếp hạng cao trên Google (và các công cụ tìm kiếm khác), chúng ta nên nhận thức được một số sai lầm phổ biến.

Liên kết nội bộ và bên ngoài bị hỏng

Một website càng có nhiều trang, khả năng có liên kết bị hỏng càng cao. Khi một trang web tiếp tục phát triển và sản xuất nhiều nội dung hơn, có một mối nguy hiểm là các trang 404 không được phát hiện. Mặc dù việc phát triển và thêm các tính năng mới và trang đích là tốt, chúng ta phải luôn chú ý đến các vấn đề với liên kết nội bộ và bên ngoài.

Là người dùng, chúng ta không thích tới một trang không hoạt động, phải không? Điều này làm gián đoạn dòng chảy của chúng ta và thường dẫn đến việc rời khỏi website ngay lập tức.

trang không tìm thấy 404
trang không tìm thấy 404

Khách truy cập có thể coi trang web là không đáng tin cậy. Như chúng ta biết, Google rất giỏi trong việc xác định nhận thức của người dùng về một website/trang. Do đó, nếu người dùng không vui, kết quả là các công cụ tìm kiếm cũng sẽ không vui.

Hơn nữa, các trang bị hỏng lãng phí ngân sách thu thập dữ liệu quý giá mà có thể được sử dụng có mục đích. Chúng ta không muốn các bot dành thời gian và tài nguyên trên các trang không thể truy cập đối với người dùng.

Tin tốt là chúng ta có thể dễ dàng xác định các liên kết nội bộ và bên ngoài bị hỏng nhờ các công cụ SEO khác nhau. Đương nhiên, nếu chúng ta có một website nhỏ chỉ với vài trang, chúng ta có thể biết chúng thuộc lòng và sẽ không quá khó để đảm bảo rằng mọi thứ đang hoạt động tốt.

Tuy nhiên, khi chúng ta phát triển các website của mình, việc làm điều này một cách thủ công trở nên không thể và không cần thiết.

Mẹo: chạy các quét theo lịch trình một lần một tuần hoặc tháng và nếu bạn xác định bất kỳ liên kết bị hỏng nào, hãy đào sâu hơn và cố gắng khắc phục chúng cho phù hợp.

Công cụ SEOcrawl cách trình thu thập dữ liệu phân tích một trang để tìm vấn đề SEO
Công cụ SEOcrawl cách trình thu thập dữ liệu phân tích một trang để tìm vấn đề SEO

Nội dung trùng lặp

Nội dung trùng lặp là một trong những vấn đề lâu đời và phổ biến nhất được biết đến trong giới marketing số. Mối quan tâm chính là bằng cách cung cấp các trang tương tự cho các công cụ tìm kiếm, bao gồm Google, chúng có thể gặp khó khăn trong việc xác định và xếp hạng các URL chính xác.

Kết quả là chúng ta (là các SEOer) có thể chịu tổn thất lưu lượng truy cập hoặc đơn giản là không nhận được lợi ích đầy đủ từ các website của mình.

Là các chuyên gia công cụ tìm kiếm, chúng ta cần đảm bảo rằng nội dung của chúng ta là duy nhất. Để làm cho cuộc sống của các công cụ tìm kiếm dễ dàng hơn, chúng ta nên tránh một số cạm bẫy phổ biến.

Thường thì nội dung trùng lặp xảy ra do cho phép các phiên bản khác nhau của cùng một trang có sẵn cho người dùng và bot. Ví dụ, có cả phiên bản http và https của một website tải mà không có chuyển hướng phù hợp là một vấn đề phổ biến.

Để tránh vấn đề tiềm ẩn này, chúng ta cần thiết lập các chuyển hướng http sang https chính xác. Chúng ta có thể dễ dàng kiểm tra điều đó bằng cách gõ http://oursitename.com trong trình duyệt. Trong trường hợp giao thức https của chúng ta được kích hoạt và thiết lập chính xác, trình duyệt sẽ chuyển hướng chúng ta đến https://oursitename.com.

ví dụ về một website chưa kích hoạt chuyển hướng phiên bản http không bảo mật sang https
ví dụ về một website chưa kích hoạt chuyển hướng phiên bản http không bảo mật sang https

Theo cách tương tự, phiên bản không có www của một website nên chuyển hướng sang phiên bản www, nếu đó là phiên bản chính của website của chúng ta và ngược lại.

chuyển hướng từ phiên bản non-www sang www của một website cho chess.com
chuyển hướng từ phiên bản non-www sang www của một website cho chess.com

Tham số trong URL là một cái bẫy phổ biến khác gây ra các URL trùng lặp. Các hệ thống quản lý nội dung thường thêm các tham số sắp xếp (cho kích thước, màu sắc, kiểu dáng, v.v.) có thể dẫn đến việc có nhiều trang với cùng một nội dung.

ví dụ tham số trong URL từ Amazon
ví dụ tham số trong URL từ Amazon

Tuy nhiên, điều này không phải là điều cần lo lắng miễn là chúng ta triển khai canonical phù hợp và các thuộc tính no-index khi cần thiết.

Lưu ý: thẻ canonical là một cách phổ biến để cho Google biết tập hợp các URL tương tự nào để lập chỉ mục và tính là URL chính. Một cách khác là sử dụng thuộc tính no-index khi các tham số gây ra các URL khác nhau với cùng hoặc nội dung tương tự.

Lỗi thẻ Title

Thẻ title là một trong những yếu tố SEO on-site quan trọng nhất. Chúng thông báo cho các công cụ tìm kiếm biết chủ đề chính của một trang là gì. Thẻ title cũng hiển thị trong kết quả tìm kiếm trên đầu mỗi danh sách tự nhiên. Điều này khiến chúng trở thành một trong những yếu tố then chốt và thường là yếu tố quyết định để người dùng nhấp vào một kết quả cụ thể.

Dành thời gian để thiết lập chúng đúng cách là một nhiệm vụ SEO quan trọng. Tuy nhiên, đôi khi nó bị bỏ quên, dẫn đến tỷ lệ nhấp thấp.

Các vấn đề chính với thẻ title là:

  • thiếu hoàn toàn các thẻ title

Trong trường hợp này, Google sẽ đặt một thẻ title dựa trên hiểu biết của họ về nội dung trang của chúng ta. Thông thường, nó xử lý nhiệm vụ này tốt, nhưng vẫn là một cơ hội SEO bị bỏ lỡ.

Tốt nhất là tự đặt thẻ title, đặc biệt là cho các trang quan trọng nhất của chúng ta.

  • thẻ title quá dài/ngắn

Sử dụng thẻ title ngắn là một cách bỏ lỡ để thu hút người dùng tiềm năng và khiến họ nhấp vào kết quả của chúng ta. Thực tiễn thông thường là có từ 55-65 ký tự hiển thị trong kết quả tìm kiếm.

Ngược lại, các thẻ title quá dài (trên 65 ký tự), có thể bị cắt bớt và không hiển thị đầy đủ. Điều này sẽ tạo ra một cơ hội bị bỏ lỡ khác để hiển thị toàn bộ thông điệp của chúng ta cho thế giới trực tuyến.

title và description bị cắt trong kết quả tìm kiếm Google
title và description bị cắt trong kết quả tìm kiếm Google

Như chúng ta có thể thấy ở đây, cả title và meta description đều bị cắt và do đó không cung cấp trải nghiệm người dùng tốt nhất.

  • thẻ title trùng lặp

Đó là một thực tiễn phổ biến cho các website thương mại điện tử có các thẻ giống nhau. Đáng tiếc, điều này thường xảy ra với các loại website khác. Thẻ title trùng lặp khiến các trang web khó nổi bật và khác biệt với các trang tương tự khác.

Tính năng Screaming Frog để tìm thẻ title trùng lặp
Tính năng Screaming Frog để tìm thẻ title trùng lặp

Vấn đề Robots.txt

Robots.txt là một công cụ tương đối đơn giản nhưng hữu ích cung cấp thông tin và hướng dẫn quan trọng cho các trình thu thập dữ liệu của công cụ tìm kiếm. Nó được đặt trong thư mục gốc của các website và sử dụng định dạng văn bản thuần.

Nó có thể ngăn chặn một số phần của website của chúng ta khỏi việc được thu thập dữ liệu, để các bot không phải lãng phí tài nguyên quý giá. Tuy nhiên, có một số sai lầm tiềm ẩn mà chúng ta nên biết.

Cấp quyền truy cập vào các trang Staging và Dev hoặc Bảng quản trị

Có một số cách để ngăn các công cụ tìm kiếm tiếp cận bất kỳ phiên bản thử nghiệm và đang phát triển nào của tên miền của bạn. Một trong những cách là sử dụng một lệnh trong tệp robots.txt của bạn, mặc dù có những cách hiệu quả hơn để làm như vậy (ví dụ: xác thực HTTP).

Một trong những hướng dẫn chặn phổ biến nhất cho các site WP là loại trừ thư mục bảng wp-admin. Đây là cách nó trông như thế nào:

User-agent: * Disallow: /wp-admin/

User-agent: * có nghĩa là hướng dẫn áp dụng cho tất cả các bot (Google bot, Bing bot, v.v.) và dòng thứ hai cho biết chúng ta muốn ngăn chúng thu thập thư mục /wp-admin/ và mọi thứ trong đó.

Chặn các URL quan trọng khỏi việc thu thập dữ liệu

Tương tự như lệnh trước, chúng ta không muốn cấm bất kỳ thư mục quan trọng nào trên website của mình khỏi việc được truy cập bởi các bot. Ví dụ, một sai lầm phổ biến có thể là:

User-agent: * Disallow: /example-important-directory/

Hoặc đôi khi chúng ta thậm chí có thể có điều này:

User-agent: * Disallow: /

về cơ bản có nghĩa là cấm toàn bộ website đối với tất cả các bot. Điều này thường được sử dụng trước khi "mở" website cho thế giới trong các thử nghiệm ban đầu. Tuy nhiên, đôi khi nó bị bỏ quên và các DEV hoặc SEOer quên xóa nó khi website đã sẵn sàng cho công chúng, bao gồm các công cụ tìm kiếm và người dùng.

Không bao gồm liên kết đến tệp Sitemap

Robots.txt là một cách tuyệt vời để giúp các công cụ tìm kiếm dễ dàng hơn trong việc tìm tệp sitemap của một website. Mặc dù không phải là lỗi lớn nếu chúng ta bỏ sót (đặc biệt là đối với các website nhỏ hơn), nó vẫn là một việc nhanh và hữu ích để làm.

Địa chỉ tệp Sitemap được bao gồm trong tệp robots.txt
Địa chỉ tệp Sitemap được bao gồm trong tệp robots.txt

Thảm họa Thẻ Meta Robots

Meta robots là một trong những thẻ và chỉ thị quan trọng nhất nói chung khi nói đến SEO. Đó là một cách hiệu quả để chủ sở hữu website thông báo cho các công cụ tìm kiếm rằng một trang nhất định không nên được theo dõi hoặc lập chỉ mục.

Có nhiều trường hợp sử dụng và cấu hình khác nhau, nhưng phổ biến nhất (và thường nguy hiểm) là thẻ noindex. Nó "sống" trong phần head của HTML và trông như thế này:

<meta name="robots" content="noindex,follow" />

Về cơ bản, nó có nghĩa là chúng ta không khuyến khích các công cụ tìm kiếm lập chỉ mục nội dung của chúng ta trong kết quả tìm kiếm, nhưng chúng ta muốn chúng theo các liên kết trên trang đó. Chúng ta có thể giải quyết các vấn đề tiềm ẩn khác nhau bằng cách ngăn các công cụ tìm kiếm lập chỉ mục nội dung. Ví dụ:

  • các trang có nội dung mỏng không cung cấp giá trị thực cho người dùng- các trang thanh toán trên các website thương mại điện tử- URL chứa thông tin nhạy cảm- các trang dev/staging chưa sẵn sàng để ra mắt công chúng

Vấn đề phổ biến nhất xảy ra với lệnh noindexquên xóa nó cho một trang quan trọng (hoặc toàn bộ website) bất cứ khi nào nó sẵn sàng được khởi chạy chính thức ra thế giới trực tuyến. Giả sử các DEV đã làm việc trên đó trong một thời gian dài, kiểm tra nhiều thứ, và sau đó ai đó quên xóa nó sau khi đã ra mắt.

Chắc chắn, đây là một trong những kiểm tra đầu tiên (và đơn giản nhất) cần làm nếu bạn tự hỏi tại sao một website nhất định hoặc phần cụ thể không mang lại lưu lượng truy cập tự nhiên nào.

Bạn chỉ cần mở mã nguồn và tìm kiếm (ctrl+f) lệnh "robots". Nếu bạn nhận thấy chỉ thị "no index" thì bạn đang gặp rắc rối! Tin tốt là bây giờ bạn biết lý do và cách khắc phục dễ dàng.

meta robots noindex trong mã nguồn
meta robots noindex trong mã nguồn

Canonical sai lệch

Thẻ canonical là một vũ khí mạnh mẽ trong kho vũ khí của các SEOer. Nó thường được sử dụng để tránh các vấn đề SEO tiềm ẩn với nội dung tương tự tồn tại trên các URL khác nhau.

Ví dụ, nó rất phổ biến trong các tạp chí E-commerce với các tham số khác nhau trong các trang có thể gây ra các vấn đề về nội dung trùng lặp.

Với canonical, chúng ta đơn giản nói cho các công cụ tìm kiếm biết trang nào là "chính" / "gốc", để tất cả các phiên bản khác không tạo ra vấn đề. Hơn nữa, Google sẽ biết trang nào để ưu tiên và hiển thị trong kết quả tìm kiếm.

Có một vài vấn đề có thể xảy ra ở đây. Một trong số đó, như đã đề cập, là không có canonical được đặt khi bạn có các URL khác nhau với cùng một nội dung.

canonical bị thiếu được báo cáo bởi trình thu thập dữ liệu SEOcrawl
canonical bị thiếu được báo cáo bởi trình thu thập dữ liệu SEOcrawl

Trong trường hợp canonical được đặt, đây là những nguy hiểm phổ biến nhất cần lưu ý:

  • URL canonical trỏ đến URL có thẻ noindex- URL canonical trỏ đến URL trả về mã trạng thái 4xx hoặc 5xx- URL canonical trỏ đến phiên bản http không bảo mật của một trang (khi chúng ta cũng có phiên bản bảo mật có sẵn)- không tự tham chiếu canonical (URL được gọi là canocalized)

Lưu ý: điều này có thể ổn trong trường hợp nó là cố ý, mặc dù trong hầu hết các trường hợp chúng ta sẽ muốn các canonical tự tham chiếu

  • thẻ canonical trống hoặc trỏ đến một trang không hợp lệ

Vấn đề Hreflang

Hreflang là các tham chiếu siêu liên kết trong mã HTML của một trang cho phép chúng ta chỉ định các URL thay thế được gán cho một ngôn ngữ hoặc khu vực nhất định. Chúng đặc biệt quan trọng đối với các website hoạt động ở các quốc gia khác nhau và phục vụ nội dung bằng các ngôn ngữ khác nhau.

Công cụ SEOcrawler hiển thị kiểm tra hreflang và thông tin chi tiết cho tên miền seoalive.com
Công cụ SEOcrawler hiển thị kiểm tra hreflang và thông tin chi tiết cho tên miền seoalive.com

Ý tưởng chính đằng sau các tham chiếu hreflang là đảm bảo chúng ta hiển thị đúng phiên bản website theo người dùng và quốc gia/ngôn ngữ của họ.

Ví dụ, đối với khách truy cập Tây Ban Nha, chúng ta muốn cung cấp phiên bản /es của một website/trang, đối với khách truy cập Đức, nó nên là /de, v.v.

Về cơ bản, chúng ta đang thông báo cho Google trang nào và bằng ngôn ngữ nào nó nên được hiển thị cho người dùng, tùy thuộc vào cài đặt ngôn ngữ và vị trí của họ.

Các chú thích Hreflang trông như thế này:

<link rel="alternate" href="https://www.example.com/es/" hreflang="es" />

Các vấn đề hreflang phổ biến nhất bao gồm:

  • thiếu liên kết trở lại

Các URL thay thế nên có cùng mã với trang chứa các URL hreflang thay thế. Khi sử dụng thẻ hreflang và trang X liên kết đến trang Y, trang Y phải liên kết trở lại trang X. Về cơ bản, mỗi dòng mã hreflang tham chiếu đến một trang khác nên có cùng mã trên mỗi trang mà nó được thêm vào.

  • ngôn ngữ được phát hiện không khớp với ngôn ngữ được chỉ định

Đôi khi ngôn ngữ được chỉ định trong các thẻ hreflang sẽ khác với nội dung trang thực tế

  • mã ISO sai

Một sai lầm phổ biến là sử dụng "en-UK" thay vì "en-GB" khi nhắm mục tiêu khách truy cập nói tiếng Anh ở Vương quốc Anh. Cú pháp cũng rất quan trọng. Mặc dù nhiều website sử dụng dấu gạch dưới để chỉ định ngôn ngữ trong URL của họ, chỉ dấu gạch ngang mới hoạt động cho hreflang.

  • thiếu thẻ tự tham chiếu

Thêm một thẻ hreflang tự tham chiếu là bắt buộc để đảm bảo rằng các site quốc tế được thiết lập đúng và dễ hiểu bởi các công cụ tìm kiếm.

  • sử dụng URL tương đối thay vì tuyệt đối

Một sai lầm phổ biến khác với hreflang. Chúng ta nên tránh các địa chỉ tương đối chỉ cung cấp một đường dẫn và luôn chọn đường dẫn trang đầy đủ.

Đúng:

<link rel="alternate" href="https://www.example.com/es/spanish-post" hreflang="es" />

Sai:

<link rel="alternate" href="es/spanish-post" hreflang="es" />

Đây là một công cụ hữu ích để xác định các vấn đề hreflang- https://technicalseo.com/tools/hreflang/

Nguy hiểm JavaScript

Mặc dù Google xác nhận rằng JavaScript có thể được sử dụng mà không gây ra bất kỳ vấn đề SEO nào, chúng ta nên cẩn thận với nó. Thường thì các nhà phát triển sử dụng JS để tải nội dung và liên kết quan trọng, và điều này có thể đặt chúng ta vào tình huống nơi các công cụ tìm kiếm không thể thu thập và hiểu nội dung chính xác.

Do đó, nên dành thêm thời gian và kiểm tra các website của chúng ta để xem liệu tất cả thông tin quan trọng có đang hiển thị đúng không.

Ví dụ, việc triển khai JS không tốt có thể dẫn đến Google không đọc các meta title và description mà chúng ta đã thiết lập, sau đó tạo ra các vấn đề với CTR của chúng ta trong kết quả tìm kiếm.

Trình thu thập dữ liệu SEOcrawl báo cáo thẻ title bị thiếu từ một trang
Trình thu thập dữ liệu SEOcrawl báo cáo thẻ title bị thiếu từ một trang

Đó là lý do tại sao nó cực kỳ quan trọng để nhận thức được sự diễn giải của Google về nội dung JavaScript của chúng ta và liệu chúng có thể thu thập và lập chỉ mục thông tin đúng không.

Vấn đề về khả năng sử dụng trên di động

Có lẽ sẽ không làm ai ngạc nhiên nếu chúng ta nói rằng khả năng sử dụng và hiệu suất di động của một website là hai trong số những yếu tố SEO quan trọng nhất ngày nay.

Đã vài năm trôi qua kể từ khi Google chuyển sang lập chỉ mục ưu tiên di động và xem xét phiên bản di động của một trang web với mức độ ưu tiên.

Một trong những vấn đề chính được thấy thường xuyên hơn ngày trước, là hiển thị nội dung khác nhau cho người dùng máy tính để bàn và di động. Đây là một thực hành rất nguy hiểm và có thể dẫn đến kết quả tự nhiên thấp hơn.

Một số yếu tố chính có thể ảnh hưởng đến hiệu suất website bao gồm:

  • một số lượng lớn các plugin

Cố gắng tránh xa việc cài đặt một số lượng lớn các plugin. Bạn càng có nhiều plugin, website của bạn càng nặng và cồng kềnh.

Hơn nữa, các plugin là điểm vào tiềm ẩn cho hacker (khi không được cập nhật kịp thời), vì vậy chúng cũng có thể gây ra rủi ro bảo mật.

  • hình ảnh không được tối ưu hóa

Hình ảnh là một trong những yếu tố phổ biến nhất ảnh hưởng đến tốc độ trang và hiệu suất tổng thể của website. Không ai thích các website tải chậm, vì vậy chúng tôi luôn khuyên cố gắng giữ các hình ảnh kích thước dưới 100 kb.

Công cụ Page Speed Insights từ Google với các đề xuất để định kích thước hình ảnh đúng cách
Công cụ Page Speed Insights từ Google với các đề xuất để định kích thước hình ảnh đúng cách

  • dịch vụ hosting

Hãy xem xét rằng máy chủ nơi bạn host website là nền tảng mà mọi thứ sẽ được xây dựng trên đó. Do đó, tốt hơn là không nên chọn giải pháp rẻ nhất và tự cứu mình khỏi rắc rối trong tương lai. Đáng để đầu tư thêm một chút nhưng biết rằng đổi lại bạn sẽ nhận được một dịch vụ hosting đáng tin cậy, an toàn và nhanh chóng.

Tóm lại

Như chúng ta đã thấy, có rất nhiều cách để mắc sai lầm khi nói đến SEO. Cũng đáng lưu ý rằng đây chỉ là một vài trong số những vấn đề kỹ thuật SEO phổ biến và thường gặp nhất mà chúng ta có thể gặp phải. Có nhiều cơn ác mộng SEO khác có thể xảy ra.

Hy vọng rằng chúng tôi đã giúp bạn cho đến nay có được một ý tưởng và hiểu biết tốt hơn về các vấn đề SEO chính và quan trọng hơn - cách tránh hoặc khắc phục chúng.

Chúc may mắn!

Tác giả: Ognian Mikov

Ognian Mikov

SEO bước vào cuộc đời tôi từ năm 2012, và kể từ đó tôi đã hoàn toàn say mê nó. Với tôi, SEO không chỉ là một công việc — nó vừa là niềm đam mê, vừa là sở thích luôn thôi thúc tôi học hỏi và tiến bộ mỗi ngày. Dù đang nghiên cứu những chủ đề mới, sáng tạo nội dung hay đào sâu vào các vấn đề kỹ thuật, tôi luôn bị cuốn hút bởi thế giới rộng lớn của digital marketing cùng vô vàn cơ hội để nâng cao hiệu suất của một website.

Năm 2021, tôi gia nhập SEO Alive và SEOcrawl — công ty remote đầu tiên của tôi — nơi tôi có điều kiện phát triển nhiều kỹ năng mới và tham gia vào những dự án thú vị. Quan trọng hơn cả, tôi đã có cơ hội gặp gỡ và học hỏi từ những đồng nghiệp tuyệt vời, những người sau này còn trở thành bạn bè thân thiết.

Tôi tốt nghiệp cử nhân ngành Marketing và có bằng thạc sĩ về PR & Quảng cáo. Thời gian rảnh, tôi thích ở bên con gái, chơi và xem cờ vua, bóng đá (Само Левски & Més que un club) và poker.

→ Đọc tất cả bài viết của Ognian
Thêm bài viết của Ognian Mikov

Khám phá thêm nội dung của tác giả này