Cách hoạt động của thuật toán công cụ tìm kiếm: Mọi thứ bạn cần biết

Thuật toán tìm kiếm là một tập hợp lớn các thuật toán khác, mỗi thuật toán có mục đích và nhiệm vụ riêng. Đây là cách tất cả hoạt động.

Thường thì tôi thấy mình tập trung vào các chiến lược cụ thể để thực hiện các chức năng cụ thể.

Làm cách nào để viết bản sao hấp dẫn để xếp hạng trên tìm kiếm bằng giọng nói?

Dữ liệu có cấu trúc nào tạo ra chiến thắng dễ dàng?

Đại loại như thế.

Những câu hỏi quan trọng này thường được đề cập ở đây trên Tạp chí Công cụ Tìm kiếm trong các bài viết rất hữu ích.

Nhưng điều quan trọng là không chỉ hiểu những chiến thuật nào có thể hoạt động để giúp bạn xếp hạng. Bạn cần hiểu nó hoạt động như thế nào.

Hiểu được cấu trúc mà chiến lược đang hoạt động là điều tối quan trọng để hiểu không chỉ lý do tại sao chiến lược đó hoạt động mà còn cả cách thức và những gì chiến lược đang cố gắng hoàn thành.

Trước đây, chúng ta đã thảo luận về cách các công cụ tìm kiếm thu thập thông tin và lập chỉ mục thông tin.

Chương này sẽ khám phá những điều cơ bản về cách hoạt động của các thuật toán tìm kiếm.

Thuật toán là gì? Một công thức

Nếu bạn hỏi Google thuật toán là gì, bạn sẽ khám phá ra rằng chính công cụ (và hầu hết mọi người khác) đều định nghĩa nó là “một quy trình hoặc tập hợp các quy tắc cần tuân theo trong tính toán hoặc các hoạt động giải quyết vấn đề khác, đặc biệt là bởi máy tính . ”

Cách hoạt động của thuật toán công cụ tìm kiếm: Mọi thứ bạn cần biết

Nếu bạn lấy bất cứ điều gì từ định nghĩa này, điều quan trọng là phải hiểu nó không nằm trong ngữ cảnh của chúng ta ở đây.

Một thuật toán không phải là một công thức.

Để tìm hiểu sự khác biệt, tại sao điều đó lại quan trọng và mỗi thứ lại làm gì, chúng ta hãy xem xét một chút về bữa ăn mà tôi có thể đặt trên đĩa ăn tối nay.

Chúng tôi sẽ đi với một mục yêu thích của tôi:

  • Bò nướng
  • cải ngựa
  • bánh PUD-Ding Yorkshire
  • Đậu xanh
  • Khoai tây nghiền
  • Nước thịt

(Đúng vậy, người Canada chúng tôi ăn nhiều hơn poutine và xi-rô cây phong, mặc dù cả hai đều tuyệt vời mặc dù có thể không cùng nhau.)

Thịt bò nướng cần được tẩm gia vị và nấu chín hoàn hảo.

Gia vị kết hợp với rang sẽ là một ví dụ về công thức – cần bao nhiêu mỗi thứ để sản xuất một sản phẩm.

Công thức thứ hai được sử dụng sẽ là lượng thời gian và nhiệt độ rang nên được nấu chín, dựa trên trọng lượng của nó. Điều tương tự cũng xảy ra cho mỗi mục trong danh sách.

Ở cấp độ rất cơ bản, chúng tôi sẽ có 12 công thức (6 món x 2 – một cho phép đo và một cho thời gian và thời lượng nấu dựa trên khối lượng) tạo ra một thuật toán được đặt ra với mục tiêu tạo ra một trong những bữa ăn yêu thích của Dave.

Chúng tôi thậm chí không bao gồm các công thức và thuật toán khác nhau cần thiết để tự sản xuất các nguyên liệu, chẳng hạn như chăn nuôi bò hoặc trồng khoai tây.

Tuy nhiên, chúng ta hãy thêm một công thức nữa – một công thức để xem xét lượng thức ăn khác nhau mà tôi muốn trên đĩa của mình.

Vì vậy, bây giờ chúng ta có một thuật toán để thực hiện nhiệm vụ rất quan trọng này. Tuyệt vời!

Bây giờ chúng tôi chỉ cần cá nhân hóa thuật toán đó để những người còn lại trong gia đình tôi cũng thưởng thức bữa ăn của họ.

Chúng ta cần cân nhắc rằng mỗi người là khác nhau và sẽ muốn lượng nguyên liệu khác nhau và có thể muốn các loại gia vị khác nhau.

Vì vậy, chúng tôi thêm một công thức cho mỗi người. Ổn thỏa.

Một thuật toán của các thuật toán

Thuật toán tìm kiếm và bàn ăn có điểm chung gì vậy?

Nhiều hơn bạn nghĩ.

Hãy xem xét một số đặc điểm cốt lõi của một trang web để so sánh. (“Ít” có nghĩa là không ở gần mọi thứ. Giống như thậm chí không ở gần.)

  • URL
  • Nội dung
  • Liên kết nội bộ
  • Liện kết ngoại
  • Hình ảnh
  • Tốc độ

Như chúng ta đã chứng kiến ​​với thuật toán bữa tối của mình, mỗi khu vực này được chia nhỏ hơn bằng cách sử dụng các công thức khác nhau và trên thực tế là các thuật toán phụ khác nhau.

Sẽ tốt hơn nếu chúng ta nghĩ về nó không phải là một thuật toán, mà là các thuật toán.

Cách hoạt động của thuật toán công cụ tìm kiếm: Mọi thứ bạn cần biết

Cũng cần lưu ý rằng, mặc dù có nhiều thuật toán và vô số công thức đang sử dụng, nhưng vẫn có một thuật toán.

Công việc của nó là xác định xem những người khác này có trọng số như thế nào để tạo ra kết quả cuối cùng mà chúng ta thấy trên SERP.

Vì vậy, hoàn toàn hợp pháp khi nhận ra rằng có một số loại thuật toán ở trên cùng – một thuật toán duy nhất để thống trị tất cả, có thể nói như vậy – nhưng hãy luôn nhận ra rằng có vô số thuật toán khác và nói chung chúng là những thuật toán mà chúng ta nghĩ đến khi chúng tôi đang xem xét cách chúng tác động đến kết quả tìm kiếm.

Bây giờ, trở lại với phép loại suy của chúng ta.

Chúng tôi có rất nhiều đặc điểm khác nhau của một trang web được xếp hạng giống như chúng tôi có một số yếu tố thực phẩm để kết thúc trên đĩa ăn tối của chúng tôi.

Để tạo ra kết quả mong muốn, chúng ta phải có một số lượng lớn các công thức và thuật toán phụ để tạo từng phần tử trên tấm và thuật toán tổng thể để xác định số lượng và vị trí của mỗi phần tử.

Nghe có vẻ quen?

Khi chúng tôi nghĩ về “thuật toán của Google”, điều chúng tôi thực sự đang đề cập đến là một bộ sưu tập lớn các thuật toán và công thức, mỗi bộ để thực hiện một chức năng cụ thể và được tập hợp lại với nhau bởi một khách hàng tiềm năng hoặc, tôi dám nói, thuật toán “cốt lõi” để đặt kết quả.

Vì vậy chúng tôi có:

  • Các thuật toán như Panda để hỗ trợ Google đánh giá, lọc, phạt và khen thưởng nội dung dựa trên các đặc điểm cụ thể và thuật toán đó có thể bao gồm vô số các thuật toán khác trong đó.
  • Thuật toán Penguin để đánh giá các liên kết và giải quyết thư rác ở đó. Nhưng thuật toán này chắc chắn yêu cầu dữ liệu từ các thuật toán khác đã có từ trước chịu trách nhiệm định giá các liên kết và có khả năng một số thuật toán mới được giao nhiệm vụ tìm hiểu các đặc điểm spam liên kết phổ biến để thuật toán Penguin lớn hơn có thể thực hiện công việc của nó.
  • Các thuật toán cụ thể cho từng tác vụ.
  • Tổ chức các thuật toán.
  • Các thuật toán chịu trách nhiệm thu thập tất cả dữ liệu và đưa nó vào ngữ cảnh tạo ra kết quả mong muốn, một SERP mà người dùng sẽ thấy hữu ích.

Vì vậy, chúng tôi đã có nó. Đó là cách các thuật toán tìm kiếm hoạt động cốt lõi.

Tại sao thuật toán tìm kiếm sử dụng thực thể

Một trong những lĩnh vực tìm kiếm gần đây đang được chú ý nhiều, mặc dù ít được nhấn mạnh, là ý tưởng về các thực thể.

Đối với ngữ cảnh, một thực thể được Google định nghĩa là:

“Một sự vật hoặc khái niệm là số ít, duy nhất, được xác định rõ ràng và có thể phân biệt được.”

Vì vậy, trong sự tương tự bữa tối của chúng ta, có tôi. Tôi là một thực thể.

Mỗi thành viên trong gia đình tôi cũng là một thực thể của riêng họ. Trên thực tế, đơn vị gia đình của tôi là một thực thể đối với chính nó.

Bằng cách đó, món rang và mỗi thành phần đi vào đó cũng là những thực thể riêng của chúng.

Bánh pudding Yorkshire cũng vậy và bột làm ra nó cũng vậy.

Google coi thế giới là một tập hợp các thực thể. Đây là lý do tại sao:

Trên bàn ăn tối của tôi, tôi có bốn thực thể riêng lẻ sẽ có trạng thái “đang ăn” và một loạt các thực thể đang được tiêu thụ.

Việc phân loại tất cả chúng ta theo cách này có rất nhiều lợi ích đối với Google so với việc chỉ đánh giá các hoạt động của chúng ta dưới dạng một chuỗi từ.

Mỗi thực thể ăn giờ đây có thể đã gán cho họ các thực thể có trên đĩa của họ (thịt bò nướng, cải ngựa, đậu xanh, khoai tây nghiền, bánh pudding Yorkshire nhưng không có nước thịt cho thực thể xyz1234567890).

Google sử dụng kiểu phân loại này để đánh giá một trang web.

Hãy coi mỗi thực thể ngồi trên bàn như một trang.

Thực thể toàn cầu đại diện cho tất cả chúng ta (hãy gọi thực thể này là “Davies”) sẽ nói về “bữa tối thịt bò nướng”, nhưng mỗi thực thể riêng lẻ đại diện cho một cá nhân (hoặc trang theo cách tương tự của chúng tôi) là khác nhau.

Bằng cách này, Google có thể dễ dàng phân loại và đánh giá mức độ kết nối của các trang web và thế giới nói chung.

Về cơ bản, các công cụ tìm kiếm không có trách nhiệm chỉ đánh giá một trang web – chúng phải xếp hạng tất cả chúng.

Thực thể “Davies” được xem là về “bữa tối thịt bò nướng” nhưng thực thể bên cạnh (hãy gọi thực thể này là “Robinsons”) nói về “món xào”.

Bây giờ nếu một thực thể bên ngoài được gọi là “Moocher” muốn xác định nơi ăn, các tùy chọn có thể được xếp hạng cho Moocher dựa trên sở thích hoặc truy vấn của họ.

Giá trị thực của các thực thể nằm ở đâu (theo quan điểm của tôi) là ở những gì xảy ra ngày kia. Chúng tôi có một số thức ăn thừa.

Bằng cách chế biến thực thể “thịt bò nướng” với một công thức khác và thêm vào thực thể bánh mì, pho mát và hành tây, chúng tôi có.

Cách các thuật toán tìm kiếm sử dụng các thực thể

OK, có vẻ như không rõ ràng rằng điều này quan trọng như thế nào trong việc hiểu các thuật toán tìm kiếm và cách các thực thể hoạt động theo cách này.

Mặc dù hiểu cách Google nhìn thấy toàn bộ nội dung của một trang web có giá trị rõ ràng, nhưng bạn có thể hỏi tại sao Google lại hiểu rằng thịt bò nướng và thịt bò nhúng của tôi có liên quan và trên thực tế – được lấy từ cùng một thực thể cốt lõi.

Thay vào đó, hãy xem xét Google hiểu rằng một trang web là về thịt bò nướng. Cũng hãy xem xét rằng một trang khác liên kết đến nó và trang đó nói về món bò nhúng.

Trong trường hợp này, điều cực kỳ quan trọng là Google biết rằng thịt bò nướng và thịt bò nhúng được lấy từ cùng một thực thể cốt lõi.

Họ có thể chỉ định mức độ liên quan cho liên kết này dựa trên sự kết nối của các thực thể này.

Trước khi ý tưởng về các thực thể được đưa vào tìm kiếm, các công cụ được phép gán mức độ liên quan dựa trên độ gần của từ, mật độ và các yếu tố dễ bị hiểu sai và bị thao túng khác.

Các thực thể khó thao tác hơn nhiều.

Một trang là về một thực thể hoặc không phải.

Thông qua việc thu thập thông tin trên web và lập bản đồ các cách thức phổ biến mà các thực thể có liên quan, các công cụ tìm kiếm có thể dự đoán mối quan hệ nào nên có sức nặng lớn nhất.

Vậy, các thuật toán tìm kiếm hoạt động như thế nào?
Được rồi, chúng tôi đã đắp rất nhiều mặt đất và có thể bạn đang đói. Bạn muốn một số điều cần biết.

Các vấn đề về ngữ cảnh

Điều quan trọng là phải hiểu cách các thuật toán hoạt động để áp dụng ngữ cảnh cho những gì bạn đang trải nghiệm / đọc.

Khi bạn nghe nói về bản cập nhật thuật toán, điều quan trọng là phải biết rằng những gì đang được cập nhật có thể là một phần nhỏ của một câu đố rất lớn.

Biết được điều này giúp giải thích khía cạnh nào của một trang web hoặc thế giới đang được điều chỉnh trong bản cập nhật và cách điều chỉnh đó phù hợp với mục tiêu lớn của công cụ.

Các thực thể là siêu quan trọng

Hơn nữa, điều quan trọng là phải hiểu rằng các thực thể:

  • Đóng một vai trò lớn trong các thuật toán tìm kiếm ngày nay.
  • Có các thuật toán riêng của họ.
  • Sẽ đóng một vai trò ngày càng tăng theo thời gian.

Biết được điều này sẽ giúp bạn không chỉ hiểu nội dung nào có giá trị (mức độ gần gũi của những thực thể bạn đang viết?) Mà còn cả những liên kết nào có khả năng được đánh giá thuận lợi hơn.

Và đó chỉ là một vài lợi thế.

Đó là tất cả về ý định của người dùng

Các thuật toán tìm kiếm hoạt động như một tập hợp lớn các thuật toán và công thức khác, mỗi thuật toán có mục đích và nhiệm vụ riêng, để tạo ra kết quả mà người dùng sẽ hài lòng.

Trên thực tế, có các thuật toán để theo dõi khía cạnh này của kết quả và thực hiện các điều chỉnh khi các trang xếp hạng được coi là không đáp ứng ý định của người dùng dựa trên cách người dùng tương tác với nó.

Bao gồm trong điều này là các thuật toán được thiết kế đặc biệt để hiểu các thực thể và cách các thực thể liên quan với nhau để cung cấp mức độ liên quan và ngữ cảnh cho các thuật toán khác.

 

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *