Cách các công cụ tìm kiếm trả lời câu hỏi

Có câu hỏi nào không? Công cụ tìm kiếm có câu trả lời. Nhưng bằng cách nào? Tìm hiểu cách các công cụ tìm kiếm hiểu và phân loại các truy vấn để đưa ra câu trả lời tốt nhất có thể.

Mục tiêu chính của công cụ tìm kiếm là giúp người dùng hoàn thành nhiệm vụ (và tất nhiên là bán quảng cáo).

Đôi khi nhiệm vụ đó có thể liên quan đến việc thu thập thông tin phức tạp. Đôi khi người dùng chỉ cần một câu trả lời duy nhất cho một câu hỏi.

Trong chương này, bạn sẽ tìm hiểu cách các công cụ tìm kiếm xác định loại truy vấn nào thuộc vào và sau đó là cách chúng xác định câu trả lời.

Cách Công cụ Tìm kiếm Đủ điều kiện Các loại Truy vấn

Toàn bộ bài báo, hoặc có thể là sách, có thể chỉ được viết về câu hỏi này.

Nhưng chúng tôi sẽ cố gắng tóm tắt tất cả trong vài trăm từ.

Chỉ để tránh nó ra, RankBrain có rất ít hoặc không có vai trò gì ở đây.

Vậy điều gì đang thực sự xảy ra?

Về cốt lõi, bước đầu tiên trong quy trình là hiểu thông tin nào đang được yêu cầu.

Đó là, phân loại truy vấn thành truy vấn ai, cái gì, ở đâu, khi nào, tại sao hoặc như thế nào.

Việc phân loại này có thể diễn ra bất kể những từ cụ thể đó có được đưa vào truy vấn như được minh họa bằng:

Cách các công cụ tìm kiếm trả lời câu hỏi

Vì vậy, những gì chúng ta thấy đang xảy ra ở đây là hai điều:

  • Google đã xác định rằng người dùng đang tìm kiếm câu trả lời cho một câu hỏi có thể là mục đích chính.
  • Google đã xác định rằng nếu đó không phải là mục đích chính của người dùng, thì mục đích phụ có thể sẽ khác.

Bạn có thể tự hỏi làm thế nào các công cụ tìm kiếm có thể xác định rằng người dùng đang đặt câu hỏi trong ví dụ thứ hai ở trên.

Rốt cuộc, nó không được tích hợp vào truy vấn.

Và trong ví dụ đầu tiên, làm thế nào để họ suy luận rằng người dùng đang tìm kiếm thông tin về thời tiết ở vị trí của họ thay vì chỉ nói chung.

Có một số hệ thống kết nối và cung cấp dữ liệu để tạo ra môi trường này. Về cốt lõi, nó dựa trên những điều sau:

Truy vấn hợp quy

Chúng tôi có xu hướng coi một truy vấn là một yêu cầu duy nhất với một phản hồi duy nhất. Đây không phải là trường hợp.

Khi một truy vấn được chạy, nếu không có mục đích rõ ràng có thể xảy ra hoặc khi động cơ có thể muốn kiểm tra các giả định của chúng, một trong những phương pháp mà chúng có sẵn là tạo các truy vấn chuẩn.

Google đã phác thảo quy trình trong một bằng sáng chế được cấp vào năm 2016 có tiêu đề “Đánh giá diễn giải ngữ nghĩa của truy vấn tìm kiếm” (liên kết đến phân tích của tôi để dễ đọc hơn).

Tóm lại, vấn đề được tóm tắt trong hình ảnh sau:

Cách các công cụ tìm kiếm trả lời câu hỏi

Một truy vấn với nhiều ý nghĩa có thể có.

Trong bằng sáng chế, họ phác thảo một quy trình mà theo đó tất cả các diễn giải khả thi có thể được sử dụng để tạo ra một kết quả. Tóm lại, chúng sẽ tạo ra một tập hợp kết quả cho cả năm truy vấn.

Họ sẽ so sánh kết quả từ các truy vấn 204a, 204b, 204c và 204d với kết quả từ 202. Một trong số 204-series trùng khớp nhất với từ 202 sẽ được coi là mục đích có khả năng xảy ra.

Đánh giá từ kết quả hiện tại, có vẻ như 204c đã thắng:

Cách các công cụ tìm kiếm trả lời câu hỏi

Quá trình này sẽ yêu cầu hai vòng.

Lần đầu tiên để chọn phim, lần thứ hai để chọn bộ phim.

Và càng ít người nhấp vào kết quả tìm kiếm từ trang này, kết quả càng thành công sẽ được coi là được nêu trong bằng sáng chế trong tuyên bố:

“Việc sử dụng kết quả tìm kiếm để đánh giá các diễn giải ngữ nghĩa khác nhau, các nguồn dữ liệu khác như dữ liệu nhấp qua, dữ liệu người dùng cụ thể và những nguồn khác được sử dụng khi tạo kết quả tìm kiếm được tính đến mà không cần thực hiện phân tích bổ sung.”

Liên quan đến bối cảnh của bằng sáng chế, điều này không có nghĩa là CTR là một số liệu trực tiếp. Trên thực tế, câu nói này giống với ý của John Mueller hơn khi được trả lời cho một câu hỏi về việc Google sử dụng chỉ số người dùng:

“… Đó là thứ mà chúng tôi xem xét trên hàng triệu truy vấn khác nhau và hàng triệu trang khác nhau và nhìn chung là thuật toán này đi đúng hướng hay thuật toán này đang đi đúng hướng.”

Về cơ bản, họ không sử dụng nó để chỉ sự thành công của một kết quả duy nhất, họ sử dụng chúng để đánh giá sự thành công của SERPs (bao gồm cả bố cục) nói chung.

Kết hợp thần kinh

Google sử dụng đối sánh thần kinh để xác định từ đồng nghĩa về cơ bản.

Về cơ bản, đối sánh thần kinh là một quy trình do AI điều khiển cho phép Google (trong trường hợp này) hiểu các từ đồng nghĩa từ cấp độ rất cao.

Để sử dụng ví dụ của họ, nó cho phép Google tạo ra các kết quả như:

Cách các công cụ tìm kiếm trả lời câu hỏi

Bạn có thể thấy rằng truy vấn là để tìm câu trả lời cho việc tại sao TV của tôi trông lạ mà hệ thống đã nhận dạng là tham chiếu đến “hiệu ứng opera xà phòng”.

Trang xếp hạng không chứa từ “lạ”.

Quá nhiều cho mật độ từ khóa.

Hệ thống AI của họ đang tìm kiếm các từ đồng nghĩa ở mức độ rất phức tạp để hiểu thông tin nào sẽ đề cập đến một ý định, ngay cả khi nó không được yêu cầu cụ thể.

Sự tương đồng về tình huống

Có rất nhiều ví dụ và lĩnh vực mà ngữ cảnh tình huống phát huy tác dụng nhưng cốt lõi của nó, chúng ta cần nghĩ về mục đích truy vấn thay đổi như thế nào theo các điều kiện tình huống.

Ở trên, chúng tôi đã đề cập đến một bằng sáng chế về các hệ thống tạo truy vấn chuẩn. Bao gồm trong bằng sáng chế đó là ý tưởng tạo mẫu.

Một mẫu có thể được sử dụng cho các truy vấn tương tự khác để bắt đầu quá trình nhanh hơn.

Vì vậy, nếu cần các nguồn lực để xác định rằng khi ai đó nhập một từ duy nhất có xu hướng có ngữ cảnh rộng mà họ có thể muốn định nghĩa, họ có thể áp dụng cách đó phổ biến hơn để tạo ra các kết quả như:

Cách các công cụ tìm kiếm trả lời câu hỏi

Và từ đó bắt đầu tìm kiếm các mẫu ngoại lệ, như thức ăn.

Và nói về thực phẩm, nó là một ví dụ tuyệt vời hỗ trợ niềm tin của tôi (và tôi nghĩ là logic) rằng rất có thể các công cụ sử dụng khối lượng tìm kiếm.

Nếu nhiều người tìm kiếm nhà hàng hơn công thức nấu ăn cho một cụm từ như “pizza”, tôi tin rằng có thể an toàn khi nói rằng họ sẽ sử dụng nó làm chỉ số và biết nếu một sản phẩm thực phẩm không tuân theo mẫu đó thì mẫu có thể không áp dụng.

Bộ hạt giống

Xây dựng dựa trên các mẫu, tôi tin rằng rất có thể, nếu không chắc chắn, các bộ dữ liệu gốc được sử dụng.

Các kịch bản trong đó các động cơ đào tạo hệ thống dựa trên sự hiểu biết trong thế giới thực về những gì mọi người muốn, được lập trình bởi các kỹ sư và các mẫu được tạo ra.

Dave ngồi xuống Googleplex, muốn một ít bánh pizza, Googled [pizza], nhận được danh sách top 10, nghĩ, “điều đó thật ngớ ngẩn” và bắt đầu làm việc với nhóm trên một mẫu.

Tôi chưa thực sự đọc bất cứ điều gì về bộ hạt giống trong bối cảnh này, nhưng nó có ý nghĩa và chắc chắn là tồn tại.

Tương tác trong quá khứ

Các công cụ tìm kiếm sẽ kiểm tra xem sự hiểu biết của họ về một ý định có chính xác hay không bằng cách đặt một kết quả trong một bố cục thích hợp và xem những gì người dùng làm.

Trong ngữ cảnh của chúng tôi ở trên, nếu mục đích có thể có của truy vấn “thời tiết như thế nào” là tôi đang tìm kiếm câu trả lời cho một câu hỏi, họ sẽ kiểm tra giả định đó.

Có vẻ như trên quy mô lớn, đó là một câu trả lời mà mọi người muốn.

Vì vậy, điều này có liên quan gì đến việc trả lời câu hỏi?

Câu hỏi tuyệt vời.

Để hiểu cách Google trả lời các câu hỏi, trước tiên chúng tôi cần hiểu cách họ có thể tổng hợp dữ liệu để hiểu liệu một truy vấn có phải là một câu hỏi hay không.

Chắc chắn, thật dễ dàng khi đó là truy vấn ai, cái gì, ở đâu, khi nào, tại sao hoặc như thế nào.

Nhưng chúng ta cần nghĩ về cách họ biết rằng một truy vấn như “thời tiết” hoặc “meme” là một truy vấn cho một phần thông tin cụ thể.

Đây là một truy vấn Năm W mà không có bất kỳ W nào (hoặc H cho vấn đề đó).

Khi điều đó được thiết lập bằng cách kết hợp các kỹ thuật được thảo luận ở trên kết hợp với nhau (và tôi chắc chắn rằng tôi đã bỏ sót một số kỹ thuật), tất cả những gì còn lại là tìm câu trả lời.

Vì vậy, người dùng đã nhập một từ duy nhất và công cụ đã nhảy qua nhiều vòng của nó để xác định rằng nó có khả năng là một yêu cầu cho một câu trả lời cụ thể. Bây giờ họ còn lại để xác định câu trả lời đó là gì.

Vì vậy, tôi khuyên bạn nên bắt đầu bằng cách đọc những gì John Mueller nói về các đoạn trích nổi bật và làm việc theo cách của bạn nếu có thể áp dụng cho doanh nghiệp của bạn.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *