Gặp khó khăn với một vấn đề kỹ thuật SEO? Nhà báo Patrick Stox có vài bí quyết giúp bạn chẩn đoán và giải quyết một vài vấn đề thông thường. Có rất nhiều bài báo đưa ra các danh sách cho bạn biết mục kỹ thuật SEO nào bạn nên đánh giá ở trang web của mình. Bài báo này không có các danh sách đó. Điều tôi nghĩ mọi người cần không phải là một hướng dẫn thực thi nữa, mà là các bài giúp giải quyết các vấn đề. Thường thì [info:https://www.domain.com/page] có thể giúp bạn chẩn đoán nhiều vấn đề khác nhau. Lệnh này sẽ cho bạn biết xem một trang có được lập chỉ mục không và nó được lập chỉ mục thế nào. Đôi khi Google lựa chọn sắp các trang cùng nhau trong chỉ mục của họ và xem hai hoặc nhiều hơn các phiên bản trùng lặp là cùng một trang. Lệnh này cho bạn thấy phiên bản được đặt tránh trùng lặp – không cần phải là trang được chỉ thị với thẻ tránh trùng lặp, mà là trang mà Google xem là phiên bản mà họ muốn lập chỉ mục. Nếu bạn tìm trang của mình với lệnh này và thấy một trang khác, thì bạn sẽ thấy đường dẫn khác được xếp hạng thay vì đường dẫn này trong kết quả - về cơ bản Google không muốn hai trang giống nhau trong chỉ mục của họ (thậm chí cả phiên bản trong bộ nhớ đệm hiển thị trong đường dẫn khác!). Nếu bạn có các bản trùng lặp về ngôn ngữ trong các thẻ hreflang, ví dụ vậy, thì các trang có thể được xếp vào một phiên bản và hiển thị trang sai lệch cho vị trí bị tác động. Thỉnh thoảng bạn sẽ thấy các trang kết quả tìm kiếm bị chiếm quyền, nơi mà tìm kiếm [info:] về một tên miền/trang sẽ hiển thị một tên miền/trang hoàn toàn khác. Tôi gặp điều này trong một cuộc thi SEO Hero của Wix hồi đầu năm, khi một tên miền mạnh hơn sao chép trang web của tôi và chiếm vị trí của tôi trong các kết quả tìm kiếm một thời gian. Dan Sharp cũng làm điều này với hướng dẫn SEO của Google hồi đầu năm (https://searchengineland.com/googles-seo-guide-search-rankings-hijacked-270362). &filter=0 added to Google Search URL Bổ sung &filter=0 vào đường dẫn Google Search Bổ sung &filter=0 vào cuối đường dẫn trong một tìm kiếm Google sẽ loại bỏ các bộ lọc và cho bạn thấy nhiều trang web hơn mà Google xem xét. Bạn có thể thấy hai phiên bản của một trang khi bạn bổ sung lệnh này, điều chỉ báo các vấn đề về trùng lặp trang mà không đi cùng nhau; chúng có thể đều nói rằng mình là phiên bản đúng, và có các tín hiệu để hỗ trợ điều đó. Đường dẫn phụ này cũng cho bạn thấy các trang đủ điều kiện khác mà có thể có thứ hạng cho truy vấn này. Nếu bạn có nhiều trang đủ điều kiện, bạn có nhiều cơ hội để hợp nhất các trang hoặc bổ sung các liên kết nội bộ từ các trang phù hợp khác tới trang bạn muốn có thứ hạng. Toán tử tìm kiếm site: Tìm kiếm [site:domain.com] có thể tiết lộ về sự giàu có về kiến thức về trang web. Tôi sẽ tìm kiếm các trang được lập chỉ mục theo các cách mà tôi không ngờ tới, như là với các thông số, các trang trong các mục tôi có lẽ không biết đến, và bất cứ vấn đề nào với các trang được được lập chỉ mục mà không nên được như thế (như là một máy chủ cho nhà phát triển). site:domain.com từ khóa Bạn có thể sử dụng lệnh [site:domain.com từ khoá] để kiểm tra các trang phù hợp trên trang của mình để xem xét sự hợp nhất hoặc các cơ hội cho liên kết nội bộ. Tìm kiếm kiểu này cũng thú vị ở chỗ nó cho bạn thấy trang web của mình có đủ điều kiện để là một bản tin ngắn đặc biệt cho từ khoá đó hay không. Bạn có thể tiến hành tìm kiếm này cho nhiều trang web đứng đầu để xem những gì có trong đoạn tin ngắn của họ có đủ điều kiện thể bạn thử và tìm ra thứ mà trang web của bạn đang không có hoặc tại sao một đoạn tin lại được hiển thị thay cho một đoạn khác. Nếu bạn sử dụng một “cụm từ” thay vì một từ khoá, điều này có thể được sử dụng để kiểm tra liệu nội dung có được Google chọn hay không, điều hữu ích trên các trang web sử dụng JavaScript. Tĩnh và động Khi bạn làm việc với JavaScript (JS), điều quan trọng phải hiểu được là JS có thể viết lại mã HTML của một trang web. Nếu bạn đang xem xét mã nguồn hoặc thậm chí bộ nhớ tạm của Google, thứ bạn đang xem là các mã lệnh không được thực thi. Chúng không phải là các xem xét tốt có thể được bổ sung khi JS được thực thi. Sử dụng “inspect” thay vì “view-source” để xem những gì được tải vào DOM, và sử dụng “Fetch and Render” trong Google Search Console thay vì bộ nhớ tạm của Google để có được ý tưởng tốt hơn về việc Google thực sự xem xét trang thế nào. Đừng nói với mọi người nó là sai vì nó nhìn buồn cười trong bộ nhớ tạm hoặc có gì đó không ở trong mã nguồn; nó có thể là bản thân bạn là người sai. Có đôi lúc khi bạn xem mã nguồn và nói thứ gì đó đúng, nhưng khi thực thi thì thứ gì đó trong phần <head> bị hỏng và làm cho nó kết thúc sớm, đưa nhiều thẻ tránh trùng lặp và hreflang vào phần <body>, nơi chúng không được hỗ trợ. Tại sao các thẻ này không được hỗ trợ trong phần body? Nhiều khả năng nó sẽ cho phép chiếm quyền trang từ các trang web khác. Kiểm tra các chuyển hướng và phản hồi từ máy chủ Bạn có thể tiến hành các kiểm tra này với Chrome Developer Tools, hoặc dễ dàng hơn là với các phần mở rộng như Redirect Path hoặc Link Redirect Trace. Nếu bạn lo lắng về một phần cụ thể và nếu như các tín hiệu đang được tập trung, hãy kiểm tra báo cáo “Links to Your Site” trong Google Search Console và tìm các liên kết tới trang sớm hơn trong mắt xích để xem xem chúng có trong báo cáo trang và hiển thị là “via intermediate link” hay không. Nếu có, chắc chắn là Google đang đếm các liên kết và tập trung các tín hiệu tới phiên bản mới nhất của trang. Với các phản hồi từ máy chủ, có thể là thú vị. Rất hiếm khi bạn thấy các thẻ tránh trùng lặp và hreflang có thể xung đột với các thẻ khác trên trang. Các chuyển hướng sử dụng HTTP Header cũng có thể là vấn đề. Nhiều lần tôi thấy mọi người đặt “Location:” cho chuyển hướng mà không có thông tin gì về trường và sau đó chuyển hướng mọi người về các trang với một chuyển hướng JS. Đúng là người dùng đi đến trang đúng, nhưng Googlebot xử lý phần Location: trước và đi tới vực thẳm. Họ không chuyển hướng tới đâu trước khi họ có thể thấy chuyển hướng khác. Kiểm tra các bộ thẻ Rất nhiều thẻ có thể ở nhiều vị trí, như HTTP Header, phần <head> và sơ đồ trang. Kiểm tra bất cứ sự không ổn định nào giữa các thẻ. Không có gì dừng được các bộ thẻ trên một trang. Có thể mẫu trang của bạn được bổ sung một thẻ meta robots, sau đó là một phần mở rộng có một bộ cho noindex. Bạn có thể giả định rằng có một thẻ cho mỗi mục, vì thế đừng dừng tìm kiếm sau tìm kiếm đầu. Tôi đã thấy 4 bộ thẻ robots meta trên cùng một trang, ba trong chúng đặt index và một đặt noindex, nhưng bộ noindex luôn thắng. Thay UA bằng Googlebot Đôi khi bạn chỉ cân thấy được những gì Google thấy. Có rất nhiều vấn đề thú vị xung quanh thủ thuật che giấu, chuyển hướng người dùng và bộ nhớ tạm. Bạn có thể thay đổi điều này với Chrome Developer Tools hoặc với một phần mở rộng như User-Agent Switcher. Tôi khuyến nghị nếu bạn làm điều này thì hãy làm trong chế độ ẩn danh. Bạn sẽ muốn kiểm tra để xem Googlebot không được chuyển hướng đến đâu đó – như là chúng không thấy được một trang ở nước khác vì chúng được chuyển hướng dựa trên địa chỉ IP Mỹ tới một trang khác. Robots.txt Kiểm tra tệp robots.txt xem có bất cứ thứ gì bị chặn không. Nếu bạn chặn một trang không cho thu thập và đặt thẻ tránh trùng lặp lên trang đó tới một trang khác hoặc một thẻ noindex, Google không thể thu thập dữ liệu trang và không thể thấy các thẻ đó. Một bí quyết quan trọng khác là theo dõi thay đổi của tệp robots.txt. Có thể có ai đó thay đổi gì đó, hoặc có thể có các vấn đề không chủ định về bộ nhớ tạm chi sẻ với một máy chủ nhà phát triển, hoặc bất cứ vấn đề nào khác – vì vậy quan trọng là xem xét thay đổi của tệp này. Bạn có thể có vấn đề với một trang không được lập chỉ mục và không thể tìm ra tại sao. Mặc dù không được hỗ trợ chính thức, nhưng một thẻ noindex qua robots.txt sẽ giữ cho trang không bị lập chỉ mục, và đây là một điều đề kiểm tra. Làm cho mình bớt đau đầu Bất cứ khi nào bạn đều có thể thiết lập một thử nghiệm tự động hoặc loại bỏ các sai lầm – những điều mà bạn biết rằng ai đó, ở đâu đó sẽ mắc phải – hãy làm điều đó. Mở rộng mọi điều đến mức bạn có thể vì luôn có nhiều công việc phải làm hơn cả nguồn lực để làm nó. Thứ gì đó đơn giản như là thiết lập Quy tắc bảo mật nội dung cho các yêu cầu nâng cấp không an toàn khi chuyển sang HTTPS sẽ giúp bạn không phải nói với tất cả những nhà phát triển rằng họ phải thay đổi tất cả các nguồn lực để sửa chữa các lỗi nội dung. Nếu bạn biết được một thay đổi có khả năng phá hỏng các hệ thống khác, cân nhắc kết quả của thay đổi đó với các nguồn lực cần và các khả năng về việc phá hỏng thứ gì đó và các nguồn lực cần để sửa hệ thống nếu điều đó xảy ra. Sẽ luôn có sự hơn thiệt với kỹ thuật và chỉ vì thứ gì đó đúng không có nghĩa nó luôn là giải pháp tốt nhất (đáng tiếc là vậy), vì vậy hãy học cách làm việc với các đội ngũ khác để cân nhắc rủi ro/thành quả với các thay đổi bạn đang khuyến nghị. Kết luận Trong một môi trường phức tạp, có thể có nhiều đội cùng làm việc trong các dự án. Bạn có thể có nhiều hệ thống, hạ tầng CMS, CDN và tương tự thế. Bạn phải giả định rằng mọi thứ sẽ thay đổi và mọi thứ sẽ sụp đổ lúc nào đó. Có rất nhiều điểm sai lầm khiến cho công việc của người làm kỹ thuật SEO thú vị và thách thức.