Trong tối ưu hóa công cụ tìm kiếm, đôi khi thậm chí những lỗi nhó có thể có tác động lớn và tốn kém. Nhà báo Patrick Stox chia sẻ các câu chuyện SEO đáng sợ của mình đẻ bạn có thể tránh chúng.

halloween1-pumpkins-ss-1920

Chúng ta đều có những lúc kinh hoàng mà ta chỉ muốn chui lại vào bụng mẹ, khóc lóc và giả vờ như vấn đề đó không tồn tại. Không may là những người làm SEO, ta không thể làm như thế quá lâu. Thay vào đó, ta phải chấp nhận và giải quyết nhanh chóng bất cứ điều gì sai lầm. Có những lúc bạn biết bạn đã sai lầm, và có những lúc một lỗi có thể tồn tại lâu mà bạn không biết. Dù thế nào, tình huống đó thật đáng sợ - và bạn phải làm việc nhiều và nhanh chóng để giải quyết bất cứ điều gì đã xảy đến. Những điều mà Google nói bạn không nên làm Có rất nhiều điều mà Google cảnh báo bạn trong hướng dẫn quản trị web của họ: • Tự động tạo nội dung • Tham gia vào các kế hoạch tạo liên kết lạm dụng • Tạo các trang với ít hoặc không có nội dung nguyên bản • Dùng thủ thuật che giấu nội dung • Chuyển hướng lén lút • Chữ hoặc liên kết ẩn • Các trang doorway sao chép nhằm tạo thứ hạng cao • Nội dung cóp nhặt • Tham gia vào các chương trình liên kết mà không bổ sung giá trị đầy đủ • Tải các trang với các từ khóa không phù hợp • Tạo ra các trang với hành vi nguy hiểm, như là lừa đảo hoặc cài virus, Trojan và các phần mềm độc hại khác • Lạm dụng các đoạn mã đánh dấu • Gửi các truy vấn tự động đến Google Không may là mọi người có thể thuyết phục bản thân rằng rất nhiều trong số những điều này là không xấu. Họ nghĩ rằng thay đổi văn bản để tránh án phạt trùng lặp nội dung là lựa chọn tốt nhất. Họ nghe rằng “các liên kết là tốt” và đột nhiên họ cố gắng trao đổi liên kết với phía khác. Họ thấy các dấu sao đánh giá nhận xét và làm giả chúng với các đánh dấu để có thể có chúng và nổi bật trong các trang kết quả tìm kiếm. Không có điều gì như trên là ý tưởng tốt cả, nhưng nó không khiến mọi người dừng việc cố gắng làm khác đi hoặc đơn giản là hiểu sai những gì người khác nói. Các vấn đề về thu thập nội dung và lập chỉ mục User-agent: * Disallow: / Đó là tất cả - chỉ hai dòng đơn giản trong tệp robots.txt để chặn hoàn toàn các tình thu thập với trang web của bạn. Thường thì nó là một lỗi trong môi trường thử nghiệm, nhưng khi bạn thấy nó, bạn sẽ thấy hoảng sợ tột độ. Cùng với điều này, nếu trang web của bạn đã được lập chỉ mục, bạn sẽ thường thấy trong các trang kết quả tìm kiếm: Sau đó là thẻ meta noindex, thứ có thể chặn một trang bạn chỉ định khỏi việc được lập chỉ mục. Không may là điều này nhiều lần có thể được bật cho toàn bộ trang web của bạn với một việc nhấn một nút đơn giản. Nó là một lỗi dễ dàng mắc phải và thật đau khi phải chứng kiến. Với UTF-8 BOM còn thú vị hơn. Glenn Gabe có một bài báo hay trong đó ông ấy giải thích như sau: BOM có nghĩa là byte order mark và nó được sử dụng để chỉ thứ tự byte cho một dòng văn bản. Nó là một ký tự vô hình nằm ở đầu một tệp (và nó cơ bản là vô nghĩa với người làm SEO). Vài chương trình sẽ thêm BOM vào một tệp văn bản, thứ … có thể vô hình với người tạo ra tệp văn bản. Và BOM có thể tạo ra những lỗi nghiêm trọng khi Google cố gắng đọc tệp. … Khi tệp robots.txt của bạn chứa UTF-8 BOM, Google có thể mắc với tệp này. Và điều đó có nghĩa dòng đầu tiên (thường là user-agent), sẽ bị bỏ qua. Và khi không có dòng user-agent, tất cả các dòng khác sẽ trả về lỗi (tất cả các chỉ thị của bạn). Và khi chúng bị coi như là lỗi, Google sẽ bỏ qua chúng. Và nếu bạn cố gắng từ chối các khu vực chính của trang web của mình, thì có thể dẫn đến một lỗi SEO lớn. Cũng chú ý rằng: Chỉ vì một lượng lớn của lượng truy cập của bạn đến từ cùng các địa chỉ IP không có nghĩa là điều xấu. Một người bạn của tôi nhận ra điều này khi anh ấy chặn vài địa chỉ IP mà trình thu thập Googlebot sử dụng khi bị thuyết phục là các IP này không đem tới gì tốt. Một tình huống đáng sợ mà tôi gặp phải đó là ai đó có một ý tưởng tuyệt vời là chặn trình thu thập để loại các trang ra khỏi chỉ mục sau một lần di chuyển tên miền phụ. Đây không bao giờ là một ý tưởng tốt, khi các trình thu thập cần truy cập vào các phiên bản cũ và đi theo các điều hướng đến các phiên bản mới. Điều này còn tệ hơn khi tệp robots.txt thực sự được chia sẻ cho cả hai tên miền phụ, và trình thu thập không thể thấy cả trang mới và trang cũ vì nó bị chặn. Các án phạt thủ công Nghe chữ “án phạt” thật đáng sợ. Nó có nghĩa là bạn hay ai đó liên quan đến trang web làm gì đó sai - rất sai! Google duy trì một danh sách của các hành động thủ công thông thường: • Các trang bị hack • Spam được tạo ra bởi người dùng • Các host miễn phí spam • Đánh dấu cấu trúc spam • Các liên kết không tự nhiên tới trang của bạn • Nội dung kém với ít hoặc không có giá trị • Che dấu nội dung hoặc chuyển hướng lén lút • Che dấu nội dung: vi phạm First Click Free • Các liên kết không tự nhiên từ trang của bạn • Spam thuần • Các hình ảnh che dấu • Các văn bản ẩn hoặc chèn đầy từ khóa Rất nhiều án phạt này là xứng đáng, trong khi vài người cố đi tắt để hưởng loại. Với việc Penguin chạy theo thời gian thực, tôi dự đoán có một đợt án phạt thủ công rất sớm sẽ đến. Một tình huống đáng sợ gần đây là mới với tôi. Một công ty đã quyết định thay đổi thương hiệu và di chuyển đến trang web mới, nhưng hóa rat rang web mới có một án phạt spam thuần. Không may vì Google Search Console không được thiết lập trước khi di chuyển, án phạt chỉ được phát hiện sau khi đợt di chuyển diễn ra. Ôi, tôi đã phá hỏng trang web! Một ký tự là tất cả những gì cần để phá hỏng một trang web. Một phần dòng lệnh hỏng, một thiết lập hỏng trong phần thiết lập, một chuyển hướng xấu hoặc một plugin hỏng. Tôi biết là mình đã phá hỏng nhiều trang web từ trước đến nay, đó là lý do tại sao sao lưu lại quan trọng trước khi bạn tiến hành bất cứ thay đổi nào. Hoặc tốt hơn là thiết lập một môi trường thử nghiệm để thử nghiệm và triển khai. Xây dựng lại một trang web Với bất cứ trang web mới nào, có rất nhiều cách để mọi thứ trở nên tồi tệ. Tôi luôn lo sợ khi có ai đó nói với tôi họ vừa mới có một trang web mới, đặc biệt khi họ nói với tôi sau khi nó đã được phát hành. Tôi có cảm giác có gì đó tồi tệ vừa mới xảy ra, và thường thì tôi đúng. Vấn đề thường gặp nhất là việc chuyển hướng không được hoàn thành, hoặc những nhà phát triển cho rằng chuyển hướng không cần thiết hoặc quá nhiều chuyển hướng sẽ làm chậm trang web. Một lỗi thường gặp khác mà tôi thấy là loại bỏ nội dung tốt, đôi khi đó là các trang về dịch vụ của họ, hoặc đôi khi cả tên miền và tất cả các thông tin sẽ bị chuyển hướng đến một trang đơn lẻ. Các vấn đề có thể trải từ các vấn đề rất cũ vẫn còn tồn tại - như đặt tất cả các chữ vào trong hình ảnh - tới các vấn đề hiện nay như “Chúng tôi vừa mới xây dựng lại trang web trong Angular” trong khi không có lý do gì để dùng Angular. Ghi đè tệp Điều làm tôi thấy sợ nhất là ghi đè các tệp từ chối, đặc biệt khi một bản copy chưa được làm và hành động mặc định là ghi đè, hoặc với một tệp .htaccess mà các chuyển hướng có thể dễ dàng bị mất. Tôi thậm chí có các host chia sẻ ghi đè tệp .htaccess, và tất nhiên không có email nào được gửi đi về các thay đổi. Tôi thậm chí không biết Trong thời gian làm việc, tôi đã thấy những điều thực sự ngẫu nhiên và tồi tệ xảy ra. Tôi đã thấy mọi người mất tên miền của họ vì nó hết hạn hoặc vì họ ký một hợp đồng nói rằng họ không sở hữu tên miền đó mà không biết. Tôi đã thấy một trang web thứ hai hoặc thậm chí thứ ba tạo bởi các công ty marketing khác. Có những lúc thẻ canonical (tránh trùng lặp nội dung) được sử dụng sai hoặc thay đổi ngẫu nhien. Tôi đã thấy tất cả các trang đều trùng với trang chủ hoặc các trang với thẻ canonical đặt với một trang web khác. Tôi đã thấy những hướng dẫn có vẻ như là ý tưởng tốt, như là “làm cho tất cả các liên kết giống tương đối” cuối cùng đưa lại thảm họa khi họ tạo các đường dẫn canonical tương đối cùng với các phiên bản khác của trang web, như là với thẻ m. và hreflang. SEO thật đáng sợ Thật đáng ngạc nhiên là một thứ nhỏ nhặt hoặc một quyết định sai có thể tốn kèm và đáng sợ đến thế. Hãy nhớ tuân theo các điều luật, kết hoạch, thực thi và kiểm soát công việc của bạn để tránh các cơn ác mộng. Hãy chia sẻ các câu chuyện đáng sợ của bạn với tôi trên Twitter @patrickstox. Nguồn: searchengineland.com