Nhà báo Patrix Stox chỉ ra khi nào phải sử dụng thẻ canonical, cũng ra các vấn đề thông thường xảy ra trong quá trình thực thi.

HTTPS-Canonical-URLs-and-301-Redirects-800x449

Trong trường hợp lý tưởng, thì chỉ có một phiên bản của mỗi trang web. Thật tệ là thế giới thực rắc rối hơn và cùng một nội dung có thể tồn tại ở nhiều chỗ ở trên cùng một trang web và các trang web khác. Hàng năm trước, một giải pháp được sử dụng để xử lý các vấn đề trùng lặp nội dung này: “phần tử canonical trong liên kết”, được biết đến như ““rel=canonical” hay “thẻ canonical”. Thẻ canonical có ích thế nào với SEO? Thẻ canonical giúp giải quyết các vấn đề trùng lặp nội dung bằng cách thiết lập phiên bản ưu tiên của một trang web và đưa các tín hiệu như liên kết tới phiên bản ưu tiên. Thẻ này giúp hợp nhất nội dung trùng lắp gây ra bởi các vấn đề như: • HTTP và HTTPS • www và không www • các tham số và điều hướng • các phần ID • các dấu gạch chéo • các trang chủ và mặc định • các phiên bản phụ như là m. hoặc AMP hoặc các phiên bản in Bổ sung canonical vào đâu Phần lớn những người làm SEO nhận thấy rằng có thể sử dụng thẻ canonical ở phần đầu, như: <link rel="canonical" href="https://example.com/" /> Điều mà bạn có thể không nhận ra là một thẻ canonical cũng có thể được thiết lập trong tiêu đề HTTP, như: HTTP/1.1 200 OK Liên kết: <https://example.com/>; rel="canonical" Thẻ canonical trong tiêu đề có thể được sử dụng cho bất cứ trang nào, nhưng trường hợp sử dụng phổ biến nhất là để thiết lập một phiên bản ưu tiên cho các tệp PDF, như Google đã làm khi Dan Sharp chiếm trang Hướng dẫn SEO của Google (http://searchengineland.com/googles-seo-guide-search-rankings-hijacked-270362). “Thẻ canonical của tôi không hoạt động” Thẻ canonical không phải là chỉ huy, nghĩa là nó có thể bị bỏ qua. Phiên bản canonical là phiên bản của trang web nên được sử dụng trong các sơ đồ trang, và việc có các đường dẫn xung đột trong sơ đồ trang hay trong các liên kết nội bộ của bạn có thể đưa ra các tín hiệu lộn xộn. Một thẻ canonical có lẽ cũng bị bỏ qua nếu như các trang không trùng lặp với nhau lắm. Các việc khác có thể sai sót, như là sao chép các trang và không thay đổi thẻ canonical hoặc để lại dòng “thay đổi tôi” hoặc “thay thế tôi” trong canonical. Bạn cugnx nên sử dụng đường dẫn tuyệt đối - không phải tương đối - trong canonical để giúp tránh các lỗi. Những thẻ này và các thẻ canonical tự định nghĩa có thể gây ra việc nhiều trang cùng thể hiện với công cụ tìm kiếm rằng chúng là phiên bản ưu tiên, điều thực sự vô lý. Nếu trang web có nhiều thẻ canonical khác nhau, thì Google sẽ bỏ qua cả hai. Google sẽ làm gì nếu có các dấu hiệu lộn xộn như nói ở trên? Họ sẽ cố xác định đường dẫn tốt nhất sử dụng các tín hiệu khác nhau như các thẻ canonical, liên kết nội bộ hoặc sơ đồ đường dẫn được khuyến nghị, nhưng còn có các yếu tố khác nữa. Ví dụ như họ có thể cố gắng chọn một đường dẫn ngắn hơn so với một đường dẫn dài hơn hoặc chọn HTTPS thay vì HTTP. Google ưu tiên các trang HTTP hơn các trang HTTP tương tự nếu trùng nội dung, trừ khi có các tín hiệu xung đột như sau (trong phần Sử dụng đường dẫn canonical trong tài liệu trợ giúp Search Console của Google): • Trang HTTPS có chứng chỉ SSL không hợp lệ • Trang HTTPS có các thành phần phụ thuộc không a toàn • Trang HTTPS bị cấm thu thập (và trang HTTP thì không) • Trang HTTPS chuyển hướng người dùng tới hoặc qua một trang HTTP • Trang HTTPS có một liên kết rel=”canonical” tới trang HTTP • Trang HTTPS chứa một thẻ meta noindex không cho thu thập dữ liệu Một trường hợp hiếm xảy ra, nhưng có thể xảy ra, là khi các lỗi lập trình khiến phần tiêu đề kết thúc trước khi nó nên kết thúc. Trong trường hợp này, một thẻ canonical có thể thực sự ở trong nội dung phần thân, nơi mà nó không được các công cụ tìm kiếm để ý. Điều tệ hơn là vấn đề này sẽ không bị phát hiện bởi phần lớn các công cụ như Screaming Frog hay Deep Crawl, hay thậm chí khi xem mã nguồn. Chỉ bằng cách xem DOM - như khi sử dụng Inspect trong công cụ phát triển Chrome - mới có thể xác định vấn đề này. Ví dụ hãy xem xét thẻ canonical của Home Depot ở hình dưới, và bạn sẽ thấy phần tiêu đề kết thúc - và phần lớn nội dung xuất hiện trong phần tiêu đề khi xem mã nguồn thực sự ở trong phần thân khi xem trong DOM. Tương tác của canonical với các thẻ khác Một thẻ canonical có thể dễ dàng bị sai vì một điều nhỏ nhặt như là lỗi đánh vần hoặc dấu gạch chéo, đặc biệt trong một bộ như đánh số trang hoặc hreflang. Trong các bộ này, việc có một trang khác nhau được lập chỉ mục chứ không phải trang có trong các thẻ sẽ khiến tập hợp các trang đó sẽ không hợp nhất như chúng nên thế, như là việc thiết lập canonical ở trang 2 của một bộ đường dẫn của trang 1. Các thẻ noindex và canonical cũng nên được sử dụng cùng nhau. Tôi đã thấy các trường hợp khi thẻ canonical dường như đưa thẻ noindex tới phiên bản ưu tiên. Các ứng dụng khác của thẻ canonical Bạn có biết các thẻ canonical có thể được sử dụng với các tên miền khác nhau? Đây thực sự là một phương cách được ưa chuộng sử dụng khi kiểm soát nội dung. Bạn cũng nên tránh trùng lặp các phiên bản phụ của trang web của bạn, như là trang di động hoặc các phiên bản AMP, quay lại với trang chính. Tuyệt hơn là theo Google, bạ sẽ không cần thay đổi các thẻ canonical của mình cho chỉ mục ưu tiên di động tới đây. Các thẻ canonical không cần thiết trong trường hợp hoàn hảo Trong khi các thẻ canonical hữu ích cho việc tập trung tín hiệu trong nhiều trang, hãy nhớ rằng trong trường hợp hoàn hảo chỉ có một phiên bản duy nhất. Tập trung các trang web với các phương thức khác như chuyển hướng sẽ tốt hơn trong dài hạn, vì bạn có thể hy vọng rằng mình tới được với một phiên bản duy nhất của một trang web. Nguồn: http://searchengineland.com