Đối mặt với các chỉ trích về “tin giả”, các gợi ý tìm kiếm không phù hợp và hơn nữa, công ty tìm kiếm đang tìm kiếm các giải pháp dài hạn và toàn diện.

google-search-new-logo1-ss-1920

Khi Google đang bị chỉ trích về các gợi ý tìm kiếm như “đàn bà có phải ác quỷ không” hoặc các kết quả tìm kiếm thực sự về việc liệu vụ thảm sát Holocaust có xảy ra hay không, những người giám sát công cụ tìm kiếm không phớt lờ vấn đề này. Họ chỉ đang bỏ thời gian để tìm ra cách tốt nhất và toàn diện nhất để phản hồi lại. Tuần này tôi vừa gặp vài kỹ sư và giám đốc liên quan tới các kết quả tìm kiếm của Google, bao gồm Ben Gomes, phó chủ tịch của tìm kiếm trung tâm. Không nghi ngờ gì rằng Google đã biết các lo ngại. Không có nghi ngờ gì về những người tại Google bị bối rối bởi những gì xảy ra. Nhưng mong muốn là tìm được các giải pháp phòng thủ nói chung trong chính sách và chúng có thể được thực thi thông qua các thuật toán, càng nhiều càng tốt. Trong thông báo mà Google đưa cho tôi sau buổi hỏi có nói: Mục đích của tìm kiếm là cung cấp các kết quả phù hợp và hữu ích nhất cho người dùng. Rõ ràng là chúng tôi không phải lúc nào cùng làm đúng, nhưng chúng tôi tiếp tục làm việc để cải thiện các thuật toán của mình. Đây là một vấn đề thực sự khó khăn, và thứ mà chúng tôi suy nghĩ rất sâu là làm thế nào có thể làm tốt hơn. Tìm kiếm là phản ánh của nội dung tồn tại trên hệ thống web. Thực sự các trang web phản cảm xuất hiện trong các kết quả tìm kiếm không có nghĩa là Google đồng ý với các quan điểm này. Đối phó với tự động hoàn thành Google sẽ không thông báo về những gì họ có thể làm, phần lớn vì họ thậm chí chưa chắc chắn là thứ đó sẽ là gì, chỉ là họ biết họ cần phải làm gì đó. Họ có hai thách thức lớn. Đầu tiên là đối phó với các gợi ý tìm kiếm, hay còn gọi là “tự động hoàn thành” (autocomplete). Đây là các gợi ý xuất hiện khi mọi người gõ vào ô tìm kiếm. Tính năng này được thiết kế để tăng tốc quá trình tìm kiếm, đặc biệt với những người dùng thiết bị di động, khi mà gõ phím có thể sẽ khó khăn. Tự động hoàn thành từ cho phép ta gõ vài ký tự và có một danh sách các tìm kiếm phổ biến xuất hiện. Ví dụ như gõ vào “best place to eat” (chỗ tốt nhất để ăn) cho ra một gợi ý như là ““best place to eat near me” (chỗ tốt nhất để ăn gần tôi), thật hữu ích và tiết kiệm thời gian:

google-2

Tuy nhiên vì các gợi ý đó được lấy ra từ các tìm kiếm phổ biến mà người dùng tiến hành trong thực thế, chúng có thể đưa đến các sự thật xấu xí về xã hội. Ví dụ như ai đó hỏi tại sao người Hoa lại tệ thế (Why are Chinese are rude):

white_pages_-_google_search

Vài người cũng hỏi người da trắng có là con người:

white_pages_-_google_search-2

Cá nhân tôi thì tôi từ lâu đã lọc bỏ nhiều các gợi ý tiêu cực nhiều nhất có thể. Lo ngại của tôi là gợi ý tự động có thể đưa ra những điều mang tính khuôn mẫu hoặc không đúng đến với những người hoặc không biết đến những điều đó hoặc không muốn biết. Nó có thể “dẫn” người tìm kiếm đến những chỗ mà họ không muốn đến. Tệ hơn là vài trong số các kết quả thực sự xuất hiện với những gợi ý tìm kiếm đó có thể không cung cấp cân bằng. Những gì Google sẽ làm ở đây là không chắc chắn, nhưng nó chắc chắn là một lĩnh vực đang được nghiên cứu để thay đổi. Bất cứ điều gì Google thực thi sẽ không hoàn hảo. Nhưng tại sao điều này sẽ là quan trọng, theo quan điểm của tôi, là Google cũng phát triển một cơ chế dễ dàng để báo cáo các gợi ý phản cảm vượt qua được và một chính sách linh hoạt và hợp lý để cho phép việc loại bỏ thủ công những gì mà thuật toán thất bại trong việc tóm được. Giờ này bạn phải biết được trang trợ giúp của tự động hoàn thành câu ở đâu để đến được với biểu mẫu báo cáo, nơi mà hoàn toàn không rõ ràng là Google sẽ loại bỏ điều gì đó hay là xem xét các từ ngữ phản cảm hoặc nội dung khiêu dâm và lạm dụng. Rõ ràng hơn, hợp lý hơn và minh bạch hơn là cần thiết. Trong khi các tìm kiếm được gợi ý phải được lọc tốt hơn, tôi cũng hy vọng là Google khiến việc nghiên cứu về những điều đó dễ dàng hơn qua Google Trends. Nó là một môi trường khác, nơi mọi người đang cố tìm kiếm để xem xem tìm kiếm phát lộ gì về xã hội. Đáng buồn là tìm kiếm phát lộ ra những điều xấu xí. Nhưng hiểu rằng có những con người thực sự - với số lượng đáng kể - những người tò mò về các khuôn mẫu là một trong những cách tốt nhất để hiểu được sự giáo dục cần có ở đâu. Lọc các kết quả? Những gì được gợi ý là một việc, nhưng thực sự quan trọng là các kết quả mà bạn có được. Ví dụ như, như được minh chứng trong tuần này, Google đã bị chỉ trích vì có trang phủ nhận vụ tàn sát Holocaust được đưa ra ở đầu tiên trong tìm kiếm về “Liệu holocaust đã xảy ra hay không”, như được hiển thị trong ví dụ từ Guardian, khi họ là bên đầu tiên viết về nó:

google_is_not_just_a_platform__it_frames__shapes_and_distorts_how_we_see_the_world___opinion___the_guardian-600x319

Làm thế nào để đối phó với kiểu kết quả đó? Có rất nhiều kêu gọi loại bỏ nó đơn giản vì nó không phải sự thực. Nhưng một sự loại bỏ một lần của trang đó không giải quyết được vấn đề cho các tìm kiếm khác và với các trang web khác. Nó cũng đưa ra một thách thức khác. Nếu chính sách là bạn loại bỏ những điều mà không dựa trên sự thật, phần lớn hệ thống web sẽ bị ảnh hưởng bởi sự kiểm duyệt của Google. Ví dụ như, liệu bạn sẽ loại bỏ các tổ chức tôn giáo lớn vì các nhóm này dựa trên các đức tin không được chứng minh - phần lớn trong số họ - thay vì các sự thật được chúng minh. Google cần các kiểu chính sách để đối phó với kiểu “thế giới với hậu sự thật” đang là mối lo ngại của nhiều người. Một suy nghĩ của tôi - và của những người khác mà tôi thấy - là có khả năng, họ có thể hợp tác với các tổ chức bên thứ ba để phát triển một danh sách của các trang cụ thể có thể bị gắn nhãn hoặc lọc bỏ, như Facebook thông báo tuần này rằng đó là việc họ sẽ làm để chống lại tin giả. Google đã dán nhãn cho các trang xác thực trong Google News, thứ được ra mắt vào tháng trước. Lọc bỏ sẽ là điều ngược lại. Nó sẽ phạt hoặc giảm bớt cơ hội của các trang mà dường như đang thúc đẩy tin giả xuất hiện với các tìm kiếm phổ biến. Với việc lọc bỏ các gợi ý tìm kiếm, không có hệ thống nào của Google đưa vào hoạt động là hoàn hảo. Đó là lý do tại sao có một chính sách tốt có thể kiểm soát được những gì được thông qua các thay đổi toán học, là một việc quan trọng. Giải thích thêm về trang web & thứ hạng? Một suy nghĩ khác là Google có thể tìm cách để làm tốt hơn trong việc cung cấp chi tiết về các trang web được liệt kê. Hiện tại bạn được thấy một tiêu đề, mô tả và đường dẫn. Nhưng những thứ mà Google sử dụng để cung cấp một điểm số “PageRank” bên cạnh các danh sách, một cách họ cố gắng để chỉ báo về độ tin cậy của một trang web. Đưa điểm số PageRank quay lại không hẳn là câu trả lời, nhưng có thể có cách khác để Google chỉ báo về độ tin cậy nhìn chung của một trang web hoặc các trang “hàng xóm” mà nó phối hợp cùng. Cuối cùng thì việc minh bạch hơn có thể hữu ích trong thứ hạng. Đây luôn là một chủ đề khó khăn với Google, vì họ sợ rằng đưa quá nhiều thông tin sẽ giúp cho mọi người thao túng công cụ tìm kiếm của mình. Tuy nhiên thật buồn cười là thứ như bài viết phủ nhận vụ Holocaust được hiển thị đầu tiên trên Google. Nó không có nhiều liên kết trỏ đến, theo một công cụ Moz mà tôi sử dụng. Trang Wikipedia phía dưới còn có nhiều độ tin cậy hơn. Có lẽ Google đã ưu ái cho tỷ lệ nhấp chuột như là một số người suy đoán. Kiểu người tìm kiếm cho việc “liệu vụ Holocaust đã xảy ra hay không” có nhiều khả năng nhấp vào các trang nói là nó không xảy ra, nếu đó là ý tưởng của họ - và vì thế các kết quả trở nên một chiều cho các tìm kiếm cụ thể, nếu bạn ưu ái các tìm kiếm có lượng nhấp chuột nhiều nhất. Google đã cương quyết là họ không sử dụng lượng nhấp chuột theo cách mô tả ở trên. Nhưng bí ẩn vẫn còn. Chúng ta thậm chí không thể xem các liên kết trỏ về thông qua Google, giờ đây mệnh lệnh cụ thể cho điều đó, dường như đã chết. Thay vào đó, ta phải phụ thuộc vào các công cụ từ bên thứ ba. Nhìn chung, nó khiến cho các chuyên gia bên ngoài khó khăn trong việc trợ giúp Google chẩn đoán các căn bệnh xếp hạng tìm kiếm của họ. Không chỉ Google Tôi nghĩ quan trọng phải lưu ý rằng vấn đề nổi lên không chỉ xảy ra với Google. Ví dụ Bing đã được khen ngợi khi vài tìm kiếm trên Google đưa đến các kết quả khó chịu trong khi Bing cân bằng hơn. Và về cá nhân thì thôi thấy Bing dường như đối phó với vấn đề này tốt hơn, khi tôi tiến hành một số tìm kiếm so sánh gần đây. Nó cho thấy nó có một thuật toán bền vững hơn với kiểu tìm kiếm này, bao gồm việc ưu ái Wikipedia hơn. Tuy nhiên Bing không hoàn hảo. Gõ vào cụm “was the holocaust” và bạn sẽ có gợi ý như là ““was the holocaust real” (có thật không) hoặc “was the holocaust justified” (đã được chứng minh chưa) như dưới đây:

bing

Lựa chọn gợi ý thứ hai về việc nó đã được chứng minh chưa, và kết quả đầu tiên là từ một trang tranh luận như sau:

was_the_holocaust_justified_-_bing

Kết quả thứ hai, không chứng minh nó. Nó có vẻ như vậy, nhưng thực tế nó là một phân tích của những người đã tiến hành. Tương tự như thế, với trang thường được khen ngợi Duck Duck Go - bản thân nó phần lớn dựa vào kết quả tìm kiếm từ Bing - tìm kiếm cho “was the holocaust” gợi ý “was the holocaust real” và “was the holocaust a hoax” (liệu có phải là trò lừa). Lựa chọn gợi ý trò lừa, và kết quả đầu tiên là một trang phủ nhận (phần phần lớn các kết quả là từ các trang phủ nhận):

was_the_holocaust_a_hoax_at_duckduckgo-2

Nhưng Google đang phản ứng Tìm kiếm thật khó khăn. Với tất cả những trò chuyện về phép thuật của máy học, các cỗ máy vẫn không thể thực sự hiểu được sự thật từ các giả tưởng. Chúng học từ con người. Và con người có thể khó đoán. Nó thậm chí còn tệ hơn khi bạn ở trong các tình huống mà các sự việc được đưa ra tranh luận. Google đã chịu chỉ trích về vấn đề này vì cuối cùng nó dẫn tới công cụ tìm kiếm. Họ cũng đồng thời tiếp tục chịu chỉ trích vì thật dễ để các tìm kiếm được tiến hành bởi nhiều người để đem đến một góc độ tấn công mới. Cũng dễ để gợi ý đây là thứ gì mới (ta không biết về điều này chút nào, hay có bằng chứng nào được đưa ra) hoặc nó chỉ được tiến hành bởi những người thao túng cánh tả (không phải thế) vì cả hai chủ đề đều nuôi dưỡng cho lo ngại về tin giả. Hãy đừng mắc lỗi. Thật tốt là vấn đề này được đưa ra ánh sáng, cho dù nó có ảnh hưởng đến tìm kiếm tổng thể rộng đến thế nào. Bài báo ban đầu của The Guardian vào hai tuần trước, nhấn mạnh rằng tìm kiếm “liệu đàn bà là quỷ dữ” và các vấn đề khác đáng để đọc và đóng một vai trò quan trọng trong việc thúc đẩy lo ngại ở đây. Cũng quan trọng cho Google phản ứng kịp thời để sửa chữa các vấn đề này, theo cách mà họ đối phó với các vấn đề khác trong tìm kiếm như là content farm (quá nhiều nội dung không chất lượng). Nó khiến cho vấn đề tự động hoàn thành câu tồn tại hàng năm. Không có đủ thời gian được dành để đối phó với điều đó. Trong vòng vài tuần, tối đa là vài tháng, ta thực sự cần thấy các thay đổi khả dĩ và ý nghĩa. Đó là đủ thời gian cho một giải pháp được hoàn thành với đủ sự suy nghĩ và quan tâm. Vai trò của nội dung tốt Tôi sẽ kết thúc với suy nghĩ cuối của mình. Một trong các cách tốt nhất để đối phó với kiểu nội dung này là thông tin tốt. Nó nhiều khả năng không xảy đến với các nguồn viết nội dung về việc Holocaust thực sự xảy ra hoặc tại sao vài khuôn mẫu là không đúng, được chỉnh sửa theo cách mà ai đó có nghi ngờ sẽ có thể tìm kiếm. Google có thể và phải tiến hành các thay đổi. Nhưng như tôi đã nói trước đây, các gợi ý tìm kiếm cũng đồng thời đưa ra các kiểu giáo dục mà cần phải tiến hành và ngôn ngữ mà nó cần phải được biểu lộ bằng. Tạo ra kiểu nội dung đó sẽ giúp Google, Bing và những hãng khác đối phó với vấn đề. Cuối cùng nếu bạn đang vạch trần tin giả và các tuyên bố hoang báo khác, đừng liên kết nó lại với các trang nguồn. Hoặc nếu bạn làm thế, hãy sử dụng nofollow. Khi một trang web tin cậy liên kết tới trang không đáng tin một cách trực tiếp - mà không sử dụng nofollow - chắc chắn việc lợi dụng độ tin cậy của nó sẽ giúp các trang không đáng tin có thứ hạng tốt hơn trong công cụ tìm kiếm. Đừng làm thế. Nguồn: http://searchengineland.com/