Bằng sáng chế của Google về các thực thể liên quan và ý nghĩa của nó với SEO

Cộng tác viên Dave Davies tóm lược các điểm chính từ một bằng sáng chế mới được công nhận của Google về các thực thể liên quan và chỉ ra các lợi ích trong xếp hạng khi tăng cường các kết hợp thực thể trong SEO và xây dựng liên kết.

Tôi đã đọc rất nhiều bằng sáng chế, rất nhiều trong chúng có thể hoặc không thể áp dụng với SEO hoặc được Google sử dụng.

Nhưng điều đó không đúng với bằng sáng chế mới được công nhận của Google “các thực thể liên quan”. Tôi tin rằng bằng sáng chế này đang được áp dụng và nó cho ta thông tin đáng kể về việc Google xác định các thực thể và thực thể liên quan mà mọi người đang tìm kiếm.

Hãy xem xét các chi tiết mà tôi nghĩ là thú vị và hiểu được cơ bản về bằng sáng chế này và mục đích của nó. Hiểu được việc Google kết hợp các thực thể thế nào sẽ giúp chúng ta nắm bắt và sử dụng các kết nối đó trong SEO.

Các thực thể liên quan

Hãy bắt đầu với việc tìm hiểu về các thực thể liên quan, đặc biệt trong bằng sáng chế US20180046717A1 của Google. Nếu bạn tìm kiếm về “các tổng thống hợp chủng quốc hoa kỳ”, đây là thứ bạn có thể thấy:

Các tổng thống được hiển thị là “các thực thể liên quan” và được liệt kê vì cụm từ “các tổng thống hợp chủng quốc hoa kỳ” được tìm kiếm. Những người khác nhau được hiển thị nhưng đều có điểm chung, đó là tổng thống của Hoa Kỳ.

Làm sao Google biết được những cá nhân đó có trong truy vấn? Đó là điều mà bằng sáng chế này giải thích. Nó nói về cách mà các thực thể liên quan này được lựa chọn và cách chúng được hiển thị. Hãy xem một ví dụ khác. Nếu ta nhấp chuột vào hình ảnh của Donal Trump trên trang, ta được dẫn tới một truy vấn về tên ông ấy được hiển thị như sau:

Khi tôi tìm kiếm tên ông ấy mà không tìm kiếm trước đó liên quan tới Tổng thống (và đã đang xuất), đây là thứ tôi thấy:

Ta có thể thấy phần điều hướng ở đầu các kết quả bắt đầu xuất hiện trong tháng Hai 2018, nhưng thêm vào đó ta thấy bối cảnh tiếp theo.

Khi ta tìm kiếm tổng thống, một bộ kết quả các tổng thống theo thời gian được hiển thị, và khi ta nhấp chuột vào hình ảnh, bối cảnh được tiếp tục với nó, vài thứ không xảy ra khi ta tìm kiếm tổng thống riêng rẽ.

Vậy điều này có nghĩa gì, và nó có gì liên quan tới bằng sáng chế này? Hãy bắt đầu tìm hiểu, và tôi sẽ nhấn mạnh các điểm chính.

Dữ liệu về các thực thể

Một trong những điểm chính là có một dữ liệu thực về thực thể.

Về cơ bản đây là một dữ liệu riêng chỉ có nhiệm vụ hiểu được về các thực thể khác nhau trên internet, đóng góp của chúng và chúng liên quan tới nhau thế nào.

Với mục đích của ta ở đây thfi ta cần nhớ rằng một thực thể không đơn thuần là một người, một nơi chốn hoặc một điều mà còn là các thuộc tính của nó.

Các thuộc tính này được kết nói bởi các quan hệ, Nếu bạn đọc bằng sáng chế nàyh, thì các thực thể được nói đến như là các “nút” và các mối quan hệ như là các “viền”. Vài thực thể và quan hệ có liên quan tới Barack Obama là:

• Có tên là Barack Obama.
• Có vị trí tổng thống Hoa Kỳ.
• Có nơi sinh là Honolulu Hawaii.
• Có vợ là Michelle Obama.
• Có tài sản ròng 12,1 triệu đô.

Và tương tự thế.

Theo logic chung và các bằng sáng chế khác, có một bộ dữ liệu riêng ngoài chỉ mục tìm kiếm thông thường:

Tôi tin rằng điều này là quan trọng, và ta sẽ quay trở lại với điều này sau khi xem xét về sự liên quan.

Định nghĩa về sự liên quan

Bằng sáng chế này nói về chủ đề quan trọng của việc định nghĩa sự liên quan.

Ta luận đàm về cách mà sự liên quan áp dụng vào các lĩnh vực khác khi tối ưu hoá cho tìm kiếm giọng nói. Có vài cách chính để Google xác định sự liên quan của các thực thể, nhưng một cơ cấu chính xuất hiện thường xuyên đó là sự xuất hiện cùng nhau của các thực thể trong cùng nguồn.

Ở ví dụ trên, điều này có nghĩa là các tổng thống khác nhau sẽ xuất hiện ở cùng trang, để chỉ báo với Google là họ có liên quan.

Ngoài ra, ta có thể cho rằng mỗi thực thể xuất hiện trên kết quả tìm kiếm sẽ ở đó cho dù họ có xuất hiện thường xuyên hay không trong cùng trang với nhau. Cho dù tổng thống Jimmy Carter không bao giờ xuất hiện cùng trang với Donal Trump, họ sẽ liên quan tới nhau bởi cụm “các tổng thống của Hoa kỳ” vì mỗi người đều kết nối tới cụm từ đó.

Đây là một ý tưởng đặc biệt quan trọng cho marketing nội dung và SEO ngoài bằng sáng chế mà ta đang bàn luận.

Xác định ưu tiên

Một lĩnh vực của bằng sáng chế áp dụng ít với SEO cơ bản nhưng vẫn đáng để bàn luận ở đây đó là Google cần một cơ chế để xác định thực thể nào và quan hệ nào quan trọng nhất.

Hiện tại Donal J. Trump là tổng thống Hoa Kỳ, nhưng ông ấy cũng là doanh nhân và có thể kết nối tới thực thể đó bởi quan hệ “đã làm công việc đó”. Và khi tìm kiếm tên ông ấy, ta thấy các kết quả ông ấy là tổng thống và không phải doanh nhân.

Một ví dụ khác: Ronald Reagan là một diễn viên trước khi là chính trị gia hay tổng thống. Và khi tìm kiếm tên ông ấy, thông tin tổng thống được trả lại đầu tiên:

Tại sao những người đó không hiển thị là doanh nhân hoặc diễn viên khi được tìm kiếm tên?

Một trong các cơ chế chính Google sử dụng để xác định thực thể và quan hệ nào quan trọng nhất là sự mới mẻ (các mối liên hệ mới thế nào ), cũng như lượng nhấp chuột vào các truy vấn liên quan kết hợp với những gì người dùng điền vào sau một truy vấn.

Về cơ bản nếu mọi người gõ vào “tổng thống Hoa Kỳ” nhiều hơn là “doanh nhân” hay “diễn viên”, thì sự quan trọng của quan hệ này sẽ tăng lên.

Yếu tố tổng thể

Các trang uy tín, đặc biệt các trang liên quan tới một chủ đề cụ thể, được ưu tiên cao hơn trong việc xác định các liên hệ của chúng với các thực thể.

Ví dụ một trang Wikipedia về Ronald Reagan bàn luận về vai trò tổng thống của ông ấy sẽ được xem xét là uy tín và củng cố quan hệ giữa tên ông ấy và cụm từ “tổng thống”.

Nếu ta nói về kỹ thuật SEO, Search Engine Land sẽ được xem là uy tín vì nó liên quan tới quy trình đó và một bên xuất bản nổi bật trong ngành SEO.

Xem nó như là PageRank cho các thực thể, dù không có gì nói cho bạn là bạn đang đi đúng hướng. Giờ hãy xem xét câu hỏi “Điều đó có ý nghĩa gì với SEO”.

Cốt lõi của bằng sáng chế

Phần nhiều trong bằng sáng chế này áp dụng tới SEO cơ bản, và không chỉ là cách hiển thị các tuỳ chọn liên quan trong kết quả tìm kiếm.

Tôi đồng ý với ý tưởng về một dữ liệu thực thể riêng rẽ với hệ thống tìm kiếm. Bạn có thể tưởng tượng nó như là một bộ dữ liệu tổng hợp tất cả các liên kết trong web để qua PageRank – sẽ mạnh mẽ hơn.

Thay vì việc đơn giản giữ một bản ghi về tất cả các liên kết và đoạn văn bản chứa liên kết trong khắp web, nó đưa mọi thứ lên một bước cao hơn và bao gồm cả việc hiểu về mối quan hệ giữa các thực thể.

Nếu bạn vận hành một khách sạn tại New York, và tên khách sạn thường được tham chiếu trên các trang web với thực thể “khách sạn”, thì mối quan hệ giữa thương hiệu và từ “khách sạn” sẽ được củng cố.

Thêm vào đó nếu khách sạn cũng tồn tại trên các trang được tối ưu cho “thành phố New York”, thì mối quan hệ thực thể đó sẽ được củng cố cho dù nó có phải là liên kết hoạt động hay không. Dù các trang có chủ đề không liên quan sử dụng cụm “thành phố New York” và tên của khách sạn, thì điểm số về sự phù hợp sẽ tăng lên.

Điều thú vị là được có mặt trên một trang với các thương hiệu khác đã liên quan nhiều đến các khách sạn New York sẽ trợ giúp cho bạn nữa, hỗ trợ cho sự phù hợp của thương hiệu của họ và chuyển tới bạn.

Không như PageRank, thứ sẽ giảm đi dựa theo số lượng liên kết, tôi chưa đọc thấy gì về sự giảm đi liên quan tới các thực thể. Nhưng điều đó không có nghĩa là nó không xảy ra. Nó đáng để xem xét.

Cạnh tranh thương hiệu

Tiếp tục với ví dụ về khách sạn, nói đến “khách sạn” trên một trang với các thương hiệu cạnh tranh, theo logic của tôi, sẽ hỗ trợ thúc đẩy độ mạnh của liên hệ với “các khách sạn”.

Nhưng nếu trang web cũng có về ăn tối và các hoạt động ở New York, thì quan hệ có thể bớt đi.

Không có thông tin nào tôi biết được khuyến nghị rằng liệu quan hệ thực thể là việc có-rồi-không, liên quan-hay-tình huống hay liệu càng nhiều thực thể được tham chiếu thì càng ít thứ được tăng giá trị hay không. Điều này là có nghĩa, và nếu điều đó đúng, các trang với sự tập trung sẽ củng cố một thực thể cụ thể liên quan hơn là một trang cơ bản.

Ta biết rằng bằng sáng chế cho thấy việc tiện cận với một thực thể là một tín hiệu, vì vậy hai cụm từ càng gần nhau trên trang, thì quan hệ giữa chúng càng mạnh.

Giống với PageRank thì uy tín là quan trọng. Không như PageRank, liên kết không quan trọng. Dù nó sử dụng nofollow hay không thì sẽ vẫn là không liên quan.

Giờ để rõ hơn, tôi đang nói đến xây dựng quan hệ thực thể và không phải PageRank. PageRank và liên kết vẫn là các tín hiệu mạnh, nhưng chúng không phải điều ta nói đến ở đây. Tôi không nói rằng bạn hãy bỏ qua xây dựng liên kết hay liên kết nofollow cũng mạnh mẽ như là follow, nhưng với điều ta nói đến ở đây thì nofollow sẽ không có vai trò gì.

Wikipedia sử dụng nofollow trong các liên kết ra ngoài, vì vậy các liên kết đó đem lại một tín hiệu mạnh mẽ.

Có người sẽ cho rằng các trang sử dụng liên kết nofollow vẫn có giá trị cao, cung cấp nội dung và cấu trúc được thể hiện theo cách mà các thực thể có thể dễ dàng liên kết.

Kết luận

Bằng sáng chế này đưa cho ta ý tưởng về việc củng cố quan hệ của trang web hoặc thương hiệu với các cụm từ và thực thể cụ thể.

Ý tưởng về việc ta có thể thúc đẩy thứ hạng thông quan quan hệ với thực thể, và không chỉ liên kết, là thực sự mạnh mẽ và linh hoạt. Liên kết cố gắng phục vụ tính năng đó và đã làm rất tốt, nhưng có rất nhiều lợi điểm để Google tiến tới một mô hình thực thể để cân nhắc cũng như cho hàng loạt các nhu cầu nội bộ khác.

Một lần nữa thì tôi không khuyên bạn bỏ đi việc xây dựng liên kết. Làm điều này cùng với xây dựng liên kết, hay thậm chí tốt hơn là tập trung vào các nỗ lực xây dựng liên kết theo cách có thể kết hợp cả hai cùng lúc.

Nếu không có gì khác, bạn sẽ buộc bản thân chạy theo các liên kết trên các trang web với chủ đề mạnh hay đối tượng phù hợp với các thuộc tính mà bạn muốn liên kết tới.

Hãy nghĩ về nó như sau: Dù bằng sáng chế này có là đồ bỏ đi, thì bạn vẫn đang làm marketing một cách thông minh.

Nguồn: https://searchengineland.com/