Câu chuyện về Penguin: Phản hồi về cập nhật mới nhất

Giới SEO phải làm gì để tận dụng hết được bản cập nhật Penguin mới? Có lẽ không có gì nhiều. Nhà báo Dave Davies lưu ý rằng dù Penguin 4.0 thực sự có ý nghĩa, thì mọi việc cuối cùng vẫn không thay đổi nhiều.

google-penguin-2016d-ss-1920

Đã hơn bốn năm chúng ta nghe nhiều về Penguin. Được giới thiệu lần đầu vào tháng Tư 2012, chúng ta được biết rằng đây là bản cập nhật thuật toán, được thiết kế để chống lại các trang web spam, sẽ ảnh hưởng đến ba phần trăm của các truy vấn.

Gần đây, chúng ta chứng kiến sự thất vọng của một phần các chủ trang web bị phạt mà phải đợi hơn một năm chờ bản cập nhật, sau khi Google lưu ý rằng một bản cập nhật sẽ đến “sớm” trong tháng Mười 2015.

Trong tất cả những năm tháng tìm hiểu về Penguin, tôi tin rằng không có bản cập nhật nào có nhiều phát biểu khó hiểu và sai lệch về thông tin hơn Penguin 4.0, bản cập nhật mới nhất. Tội đồ lớn nhất ở đây là bản thân Google, họ đã không thống nhất trong các thông điệp được đưa ra của mình.

Và đây là chủ đề của bài báo này: bỏ đi vài khía cạnh sai hoặc gây hiểu lầm của bản cập nhật này, và quan trọng hơn, nó có ý nghĩa gì với các chủ trang web và đội ngũ SEO của họ.

Vậy thì hãy bắt đầu nhé.

Penguin là gì?

Lưu ý: Ta sẽ nói phần này ngắn gọn – nếu bạn muốn có thông tin sâu hơn, bạn nên đọc bài báo của Danny Sullivan về lần phát hành đầu tiên của Penguin (http://searchengineland.com/google-launches-update-targeting-webspam-in-search-results-119295). Bạn cũng có thể vào phần Bản cập nhật Penguin trên Search Engine Land để xem tất cả các bài báo được viết về chủ đề này (http://searchengineland.com/google-launches-update-targeting-webspam-in-search-results-119295).

Bản cập nhật thuật toán được công bố lần đầu vào 24 tháng Tư, 2012, và theo giải thích chính thức thì nó là thuật toán tập trung vào các trang web spam. Tuy nhiên, khi những người tham gia vào các kế hoạch lạm dụng liên kết phải chịu tổn thất lớn nhất, thì bản thân thuật toán này được xem như là được thiết kế để trừng phạt các trang web với hồ sơ liên kết xấu.

Tôi sẽ kết thúc vấn đề này ở đây, với giả thuyết rằng tôi không nên làm phiền bạn với các chi tiết bổ sung về việc thuật toán này được thiết kế để làm những gì. Hãy chuyển sang phần các nhầm lẫn.

Các nhầm lẫn ở đâu?

Chỉ đến khi Penguin 4.0 phát hành vào 23 tháng Chín, 2016, trước đó không có nhiều nhầm lẫn xung quanh thuật toán này. Toàn bộ cộng đồng SEO – và thậm chí cả những cộng đồng khác – biết rằng cập nhật Penguin giảm hạng các trang web có liên kết xấu và chỉ đến bản cập nhật tiếp theo các trang bị ảnh hưởng mới hy vọng được phục hồi.

Điều này đã rõ ràng: một trang web khi bị một án phạt, người chủ trang web sẽ gửi các yêu cầu để loại bỏ các liên kết vi phạm, những liên kết không thể được loại bỏ sẽ được cho vào danh sách từ chối và gửi lên, và sau đó họ sẽ phải đơn giản là chờ đợi.

Tuy nhiên, mọi việc trở nên phức tạp hơn với bản cập nhật mới nhất – không chỉ bởi vì bản thân thuật toán trở nên phức tạp hơn để hiểu được, mà bởi vì những điều mà những người ở Google đã làm.

Về bản chất, có một số thay đổi lớn với bản cập nhật này:

1. Penguin giờ đã chạy ở thời gian thực. Các quản trị web bị ảnh hưởng bởi Penguin không cần phải đợi đến bản cập nhật tiếp để thấy kết quả cải thiện của họ nữa – giờ đây các thay đổi sẽ được thấy hanh hơn, thường không lâu sau khi trang web được tái thu thập dữ liệu và tái lập chỉ mục.

2. Penguin 4.0 “tinh tế”, nghĩa là nó giờ có thể tác động đến các trang riêng rẽ hoặc các phần của một trang, trước đây, nó hoạt động theo cách phạt cả trang web, tác động đến thứ hạng của cả một trang web.

Có vẻ như không có nhiều nhầm lẫn ở đây khi nhìn thoáng qua. Tuy nhiên khi những người ở Google bắt đầu bổ sung thêm các chi tiết và đưa ra các lời khuyên, cuối cùng gây ra một chút nhầm lẫn. Vì vậy hãy xem xét những việc này để hiểu rõ hơn về những gì ta cần phải làm.

Các hồ sơ từ chối

Tin đồn nói rằng, dựa trên phát bieru của Gary Illyes, hồ sơ từ chối không cần thiết với vấn đề xếp hạng của Penguin nữa (http://searchengineland.com/google-penguin-doesnt-penalize-bad-links-259981).

Điều này là do một thay đổi trong việc Penguin 4.0 xử lý các liên kết xấu: chúng giảm giá trị của các liên kết thay vì việc giảm hạng của trang web mà chúng liên kết tới.

Giờ thì điều đó khá là rõ. Nếu bạn đọc phát biểu của Illyes trong bài báo trên, có vài điểm cần rút ra:

1. Spam bị giảm giá trị, thay vì việc các trang web bị giảm hạng.
2. Nhu cầu sử dụng hồ sơ từ chối với án phạt thứ hạng của Penguin bị giảm bớt.
3. Sử dụng hồ sơ từ chối với các vấn để liên quan đến Penguin có thể giúp Google giúp bạn, nhưng nó đặc biệt hữu ích cho các trang web đang trải qua đánh giá thủ công.

Sau đây mới là vấn đề – chỉ một ngày trước, các dòng tweet này đã được trao đổi:

Bruce Clay, Inc: Chào Gary! Ông có thể nói liệu các hồ sơ từ chối có vẫn là một công cụ hữu ích với Penguin 4.0 không?

Gary Illyes: Chúng tôi đã thay đổi các khuyến nghị với công cụ từ chối với lần cập nhật này.

Vậy giờ đây bạn nghe là “đúng, bạn nên sử dụng nó cho Penguin” và “không, bạn không cần nó cho Penguin”. Nhưng đợi đã, nó trở nên buồn cười hơn. Vào mùng 4 tháng Mười 2016, Nhà phân tích xu hướng quản trị web của Google Jonh Mueller nói như sau trong Office Hours Hangout (https://www.youtube.com/watch?v=kfICh_rsOEo):

Nếu có các liên kết có vấn đề bị ảnh hưởng bởi Penguin, và bạn sử dụng một hồ sơ từ chối, thì đó là một cách tốt để chúng tôi có thể biết được “OK, liên kết này là thứ gì đó mà bạn không muốn có liên hệ tới trang web”. Vì thế khi chúng tôi tái thu thập trang web liên kết đến bạn, chúng tôi có thể bỏ liên kết đó ra khỏi biểu đồ liên kết.

Liên quan đến việc giảm giá trị của các liên kết chất lượng thấp thay vì phạt bạn, về cơ bản chúng tôi cố tìm ra được chiến thuật spam nào đang được sử dụng và chúng tôi nói “Vâng, chúng tôi sẽ cố bỏ qua phần này liên quan đến trang web của bạn”.

Vậy… rõ ràng không?

Điều rút ra từ hồ sơ từ chối

Điều rút ra ở đây là mọi thứ càng thay đổi, thì chúng càng như cũ. Không có gì thay đổi cả. Nếu bạn sử dụng chiến thuật xây dựng liên kết không đúng trước đây và xem xét việc nộp hồ sơ từ chối – bạn nên làm thế. Nếu bạn chưa từng sử dụng chiến thuật như thế, thì bạn không cần làm điều đó; nếu Google thấy các liên kết xấu trong trang của bạn, họ đơn giản sẽ giảm giá trị của chúng.

Tất nhiên họ cũng có lần nói rằng SEO tiêu cực sẽ không hoạt động, nghĩa là không cần thiết một hồ sơ từ chối với các liên kết xấu mà bạn không xây dựng. Điều này rõ ràng không phải như vậy, và SEO tiêu cực vẫn hoạt động tốt, vì thế bạn nên tiếp tục theo dõi các liên kết của mình để tìm ra các liên kết xấu và thêm nó vào hồ sơ từ chối theo định kỳ. Sau cùng, nếu các liên kết xấu không thể tác động đến trang web của bạn, thì không cần hồ sơ từ chối nào cả.

Và vì thế, mọi thứ càng thay đổi, chúng lại càng như cũ. Hãy tiếp tục làm những gì bạn đang làm.

Trang web nguồn?

Trong một bản tin radio gần đây trên Marketing Land (http://marketingland.com/podcast-marketing-land-live-30-conversation-googles-gary-illyes-part-1-194202), Gary Illyes lý giải rằng với Penguin, trang đích của liên kết không phải vấn đề, vấn đề là trang nguồn. Điều này không chỉ bao gồm bản thân các liên kết, mà còn các dấu hiệu khác mà một trang gửi đi để chỉ báo rằng đó là spam.

Vì vậy những gì ta được thông báo đó là giá trị của liên kết đến từ trang web mà nó có mặt và không phải nơi mà nó hướng đến. Nói cách khác, khi bạn đánh giá các liên kết trỏ về, hãy đảm bảo rằng xem xét trang nguồn và tên miền của các liên kết đó.

Mọi thứ càng thay đổi, chúng càng trở nên như cũ.

Các liên kết của bạn được dán nhãn

Trong cùng buổi nói chuyện qua radio về Penguin, có thể thấy rằng Google đặt liên kết trong một trang vào các mục, như:

• Footer;
• Bị ảnh hưởng bởi Penguin; và
• Bị từ chối.

Nó gợi ý rằng có các mục khác, nhưng chúng không được nêu tên. Vậy, điều này thực sự mang ý nghĩa gì?

Nó có nghĩa những gì chúng ta đã biết trong cả một thập kỷ. Chúng ta giờ có một cụm từ để mô tả nó (“dán nhãn”) thay vì việc đơn giản hiểu được một trang được chia thành các phần, và các phần hiện hữu nhất và dễ tham gia nhất sẽ có giá trị cao nhất (liên quan tới cả nội dung và liên kết).

Có một điều mới

Chỉ một thông tin mới ở đây là hoặc Google đã thay thế hệ thống cân đo liên kết trước đây (dựa vào thứ gì đó như là khả năng hiển thị) với một hệ thống dán nhãn, hoặc họ đã bổ sung vào nó. Cơ bản là trong khi trước đây nôi dung về tổng thể có thể đã được phân mục và các liên kết được bổ sung vào các mục đó, giờ đây một liên kết được gán một hoặc có thể là nhiều nhãn.

Vì vậy, đây là một hệ thống mới và một thông tin mới, điều này dẫn chúng ta đến…

Điều rút ra được từ dán nhãn liên kết

Biết được liệu liên kết được dán nhãn hoặc đơn giản đánh giá bởi vị trí của nó trên trang – và liệu nó có bị từ chối hay không – không thể dựa vào đó để hành động đựa. Điều thú vị là, tôi chắc chắn nó đã khiến các kỹ sư của Google mất nhiều thời gian để làm việc với nó (có lẽ họ đã làm việc với nó từ tháng Mười năm ngoái). Nhưng dưới góc nhìn của SEO, chúng ta phải hỏi bản thân “Điều gì thực sự đã thay đổi?”.

Chẳng gì cả. Bạn sẽ vẫn phải làm việc để phát triển các liên kết có khả năng hiển thị cao, đặt chúng phù hợp và trên các trang liên quan. Nếu điều này khác xa với những gì bạn đang làm, bạn có nhiều khả năng không xây dựng liên kết đúng cách. Tôi nhắc lại là: Mọi thứ càng thay đổi, chúng lại càng như cũ.

Nhưng không phải án phạt Penguin chứ? Hay là…?

Hóa ra là các án phạt Penguin được đối xử rất khác ở bản 4.0 so với trước. Trong một thảo luận với Gary Illyes từ Google, ông ấy nói rằng không có một sự trừng phạt nào với các án phạt của Penguin (https://www.beanstalkim.com/blog/2016/10/no-sandbox-penalized-sites-penguin/).

Để rõ hơn về bối cảnh, sau đây là một phần của cuộc trò chuyện:

Beanstalk IM: Với việc Penguin chạy thời gian thực, việc phục hồi sẽ ngay lập tức khi được sửa hay nó sẽ có sự trì hoãn?

Beanstalk IM: Anh cũng để ý đến điều đó hả? 🙂
Gary Illyes: Sự trì hoãn chỉ là trì hoãn gây ra bởi thu thập dữ liệu và lập chỉ mục.
Beanstalk IM: Vậy không có sự trì hoãn nội-tại nào được xây dựng sẵn khi chủ trang web chứng minh rằng họ không chơi xấu với các trang web khác? Không có “sự trừng phạt”?
Gary Illyes: Không

Beanstalk IM: Các anh phải rất tự tin vào thuật toán của mình. 🙂
Gary Illyes: Chúng tôi có thành phần bảo vệ được xây dựng sẵn để chống lạm dụng, hãy nhớ điều đấy 😉

Vì vậy về cơ bản, nếu bạn chịu một án phạt bởi Penguin, không có trì hoãn trong việc phục hồi – khi bạn đã sửa lỗi và trang web của bạn được tái thu thập dữ liệu, bạn sẽ quay trở lại.

Với điều đó, có gì đó đáng ngại về dòng tweet cuối của Illyes. Vậy Penguin không yêu cầu hoặc áp đặt sự trừng phạt hay trì hoãn dựa trên tín nhiệm… nhưng không có nghĩa là không có các tính năng khác trong thuật toán của Google làm việc này.

Vậy ta kết luận điều gì? Tránh các án phạt – và nếu các án phạt không liên quan đến Penguin, có thể hoặc có thể không có các trì hoãn trong phục hồi. Nghe quen chứ nhỉ? Bởi vì (tôi chắc là bạn bây giờ có thể nói cùng tôi)…

Mọi thứ càng thay đổi, chúng càng như cũ

Trong khi đây là một bản cập nhật lớn với vài sự thay đổi đáng kể, điều có ý nghĩa nhất là quá trình SEO của chúng ta thực sự không thay đổi gì cả. Các liên kết của chúng ta được bắt nhanh hơn (cả liên kết tốt và xấu), và các án phạt sẽ được phát ra và thu lại chắc chắn hơn; tuy nhiên các liên kết ta cần xây dựng và chúng sẽ được cân đo thế nào vẫn như cũ (nếu không nói là y hệt). Việc sử dụng hồ sơ từ chối không thay đổi, và bạn vẫn nên để ý đến SEO tiêu cực (theo quan điểm của tôi).

Biến số lớn nhất ở đây đến từ phát ngôn rằng Penguin không bị ảnh hưởng bởi máy-học:

Jennifer Slegg: Liệu Penguin có phải là một thuật toán máy-học, hay sử dụng hình thức nào đó của học giám sát hoặc học không giám sát?
Gary Illyes: Không.

Tôi không nghi ngờ gì về việc nó là sự thật. Tuy nhiên khi giờ Penguin là một phần của thuật toán cốt lõi – và máy-học đóng một vai trò lớn trong việc các công cụ tìm kiếm xếp hạng trang web – có nhiều khả năng cuối cùng nó sẽ kiểm soát vài khía cạnh mà thuật toán Penguin trước đây vẫn làm.

Nhưng khi thời điểm đó đến, các cỗ máy sẽ xem xét độ phù hợp và tối đa hóa trải nghiệm người dùng và các tín hiệu liên kết chất lượng. Vì thế bạn càng tiếp tục tập trung vào những gì phải làm… thì chúng sẽ càng như cũ.