Cách (& Tại sao) Công cụ Tìm kiếm Hiển thị Trang?

Làm cách nào để các công cụ tìm kiếm hiển thị các trang trên web? Tại sao và khi nào họ làm điều đó? Những câu hỏi này và nhiều hơn nữa được trả lời trong bài đăng này.

Có một bước ngoặt thú vị trong cách chúng ta nghĩ về lập chỉ mục – và đó là kết xuất.

Khi chúng ta nghĩ về việc xếp hạng các trang, chúng ta thường nghĩ đến việc lập chỉ mục.

Có nghĩa là, chúng ta thường nghĩ về thời điểm khi công cụ tìm kiếm có:

  • Đã phát hiện ra một trang thông qua sơ đồ trang web hoặc thu thập thông tin và đã tiếp tục, sau đó truy cập trang đó để lập chỉ mục.
  • Thu thập tất cả các nội dung thông qua nguồn trang.
  • Đã bắt đầu xếp hạng trang cho các truy vấn.

Trong lịch sử, đây là tập hợp các bước quan trọng nhất trong quy trình vì nó là yếu tố kích hoạt xếp hạng.

Tuy nhiên, lập chỉ mục không phải là giai đoạn cuối cùng của quá trình khám phá.

Tôi đề nghị rằng trọng lượng của nó sẽ giảm theo thời gian trong khi giai đoạn cuối cùng – hiển thị – tăng lên và tôi nghi ngờ sẽ thay thế hoàn toàn phiên bản đã lập chỉ mục.

Lập chỉ mục so với Kết xuất: Sự khác biệt là gì?

Về cơ bản, đây là nội dung giống nhau, được xem như trong quá trình lập chỉ mục (HTML) và hiển thị (Chrome).

Vì sao vấn đề này?

Kết xuất quan trọng hơn bạn nghĩ.

Thực tế là các công cụ tìm kiếm đã hiển thị các trang trước khi đẩy mạnh sử dụng JavaScript cho các trang web gần đây, là một xác nhận tốt.

Về cơ bản, lý do quan trọng là kết xuất cung cấp sự thật.

Với mã, công cụ tìm kiếm có thể hiểu nội dung của trang và đại khái là chuyện gì đang xảy ra.

Với kết xuất, họ có thể hiểu trải nghiệm người dùng và hơn thế nữa về nội dung nào nên ưu tiên.

Với kết xuất, họ có thể trả lời các câu hỏi như:

  • Nội dung có ẩn sau một cú nhấp chuột không?
  • Một quảng cáo có lấp đầy trang không?
  • Nội dung xuất hiện ở cuối mã, thực sự được hiển thị ở phía trên cùng hay trong điều hướng?
  • Một trang tải chậm?

Tất cả những câu hỏi này và nhiều câu hỏi khác đều được trả lời trong quá trình kết xuất.

Những câu trả lời này rất quan trọng để hiểu đúng một trang và cách nó nên được xếp hạng.

Khi nào kết xuất xảy ra?

Không có gì đáng ngạc nhiên, bây giờ mất ít thời gian hơn nhiều.

Thực tế là vài giây.

Vào khoảng 18:20 trong đoạn âm thanh ở đây, bạn sẽ nghe thấy Martin Splitt của Google chỉ trả lời câu hỏi này.

Bao lâu cho đến khi Google hiển thị một trang?

Phương tiện là 5 giây và trong vòng vài phút, 90% các trang được lập chỉ mục sẽ thông qua hàng đợi hiển thị.

Cần lưu ý rằng đây là xếp hàng, không nhất thiết phải kết xuất.

Có nghĩa là, nếu bạn ở phía tích cực của tập hợp phương tiện bắt đầu trong vòng 5 giây, trang của bạn sẽ bắt đầu hiển thị trong vòng 5 giây, mặc dù nó có thể không hoàn thành trong thời gian đó.

Nếu quá trình kết xuất bắt đầu sau 4 giây nhưng mất 30 giây để hoàn thành, nó sẽ được coi là một trong số những người được tính ở mặt tích cực của tập hợp phương tiện.

Chúng ta đã đi một chặng đường dài trong 2 năm, từ vài tuần đến vài giây.

Bing hoạt động theo cách khác.

Có lẽ, họ cũng đã đẩy nhanh tiến độ, mặc dù tôi không có xác nhận mới hơn về thời gian.

Vì vậy, câu trả lời ngắn gọn về thời điểm kết xuất diễn ra là: “sau khi lập chỉ mục” và dòng thời gian có thể thay đổi nhưng ngắn, về cơ bản có nghĩa là các công cụ tìm kiếm sẽ hiểu nội dung và ngữ cảnh của một trang trước khi hiểu đầy đủ về nó như thế nào được ưu tiên, nhưng trong hầu hết các trường hợp, độ trễ là tranh cãi.

Googlebot Evergreen

Một bước tiến lớn đã diễn ra vào tháng 5 năm 2019 khi thành phần Dịch vụ kết xuất web (WRS) của Googlebot được cập nhật.

Cho đến thời điểm đó, Dịch vụ kết xuất web đang sử dụng Chrome phiên bản 41.

Mặc dù điều này rất tốt cho khả năng tương thích, nhưng đó là một cơn ác mộng đối với các trang web dựa vào các tính năng hiện đại của JavaScript.

Vào tháng 5 năm 2019, Dịch vụ kết xuất web đã được nâng cấp lên thường xanh, có nghĩa là dịch vụ này sử dụng phiên bản Chrome mới nhất để hiển thị (bất kỳ tỷ lệ nào trong vòng vài tuần).

Về cơ bản, bây giờ khi trang của bạn được hiển thị bởi Google, nó sẽ hiển thị ít nhiều như cách bạn nhìn thấy nó trong trình duyệt của mình.

Dịch vụ kết xuất web làm gì?

Tôi muốn nhanh chóng trả lời một câu hỏi mà tôi thấy mình không hoàn toàn quấn lấy bộ não của mình cho đến khi tôi nhận ra rằng tôi đã nghĩ về nó hoàn toàn sai lầm.

Bạn có thể cười nhạo tôi vì sự nấc cụt trong não tôi rõ ràng.

Trước tiên, hãy xem xét nơi Dịch vụ kết xuất web nhận được hướng dẫn và cách thức.

Về cơ bản đây là vòng đời của kết xuất:

  • Một trang được phát hiện qua sơ đồ trang web, trình thu thập thông tin, v.v.
  • Trang được thêm vào danh sách các trang sẽ được thu thập thông tin trên một trang web khi có ngân sách thu thập thông tin.
  • Nội dung trang được thu thập thông tin và lập chỉ mục.
  • Trang được thêm vào hàng đợi kết xuất.
  • Trang được kết xuất.

Vì vậy, một yếu tố quan trọng và bất thành văn của quy trình là hàng đợi kết xuất.

Khi một trang chạm đến đầu hàng đợi để hiển thị, công cụ sẽ gửi những gì được gọi là trình duyệt không có đầu đến nó.

Đây là bước tôi gặp khó khăn.

Trình duyệt không có đầu là trình duyệt không có giao diện người dùng đồ họa.

Vì một số lý do, tôi đã gặp khó khăn trong việc xoay quanh bộ não của mình về cách hoạt động của nó.

Giống như, làm cách nào để Google biết được những gì ở đó nếu nó không được hiển thị bằng đồ thị?

Câu trả lời rõ ràng là:

“Con bot cũng không có mắt nên… ừm… vâng.”

Qua trục trặc tinh thần đó, tôi coi nó như một “đèn trình duyệt” hiển thị trang để công cụ tìm kiếm giờ đây có thể hiểu những gì xuất hiện ở đâu và như thế nào trên một trang – mặc dù họ không có mắt để nhìn thấy nó.

Khi mọi việc suôn sẻ, phiên bản được kết xuất sẽ xuất hiện với Googlebot giống như đối với các trình duyệt đồ họa và nếu không có thì có thể là do trang dựa trên một tính năng không được hỗ trợ như yêu cầu quyền của người dùng hoặc một trong các tập lệnh hoặc các tài nguyên khác bị sai sót.

Điều gì về kết xuất trước?

Kết xuất trước là việc sử dụng thư viện như Puppeteer (thư viện mà tôi quen thuộc nhất được dùng làm ví dụ) để tạo các bản sao HTML được lưu trong bộ nhớ cache của các trang JavaScript và cung cấp các bộ nhớ cache đó cho Google.

Về cơ bản, đó là một hình thức đạo đức về kỹ thuật che giấu, nơi bạn tạo một bản sao của trang giống như nó sẽ xuất hiện trong DOM và phân phát trang đó cho các công cụ tìm kiếm, để đảm bảo họ thấy cùng một nội dung mà người dùng làm khi họ ghé qua để lập chỉ mục Nội dung.

Với sự sụt giảm đáng kể về độ trễ thời gian giữa lập chỉ mục và hiển thị, câu hỏi rõ ràng đã xuất hiện trong tâm trí tôi – tôi có cần phải kết xuất trước trang web JavaScript của mình không?

“Hãy hỏi và đôi khi bạn sẽ nhận được” câu trả lời từ Google.

Và đây là một trong những thời điểm đó.

Đây là một tin tuyệt vời cho những người đang chạy Puppeteer hoặc một thư viện kết xuất trước khác.

Tôi biết rằng tôi đã thấy các trường hợp hệ thống kết xuất trước gặp sự cố mà không có thông báo lỗi, gây ra rất nhiều vấn đề đau đầu (đọc: các trang giảm khỏi chỉ mục).

Nếu chúng tôi không cần kết xuất trước, chúng tôi không cần phải lo lắng về những điều như vậy.

Tất nhiên từ tác ở đây là “nói chung.”

Vì vậy, nếu bạn đang nghĩ đến việc tắt hệ thống kết xuất trước của mình, tôi khuyên bạn nên dừng hệ thống chạy trên một số trang và chờ xem điều gì sẽ xảy ra khi chúng được sửa lại.

Google có nhìn thấy nội dung khi nó được hiển thị không?

Nếu vậy, bạn có thể dừng kết xuất trước hoàn toàn.

Tại sao phải kết xuất?

Bạn có thể tự hỏi mình, tại sao lại phải kết xuất ngay từ đầu? Nếu một trang web không phải là JavaScript hoặc phụ thuộc vào việc hiển thị để “xem” nội dung, tại sao Google lại cần hiển thị các trang?

Kết xuất cung cấp cho các công cụ khả năng ưu tiên nội dung dựa trên cách một người có thể sẽ tương tác với một trang.

Nó cho phép công cụ biết nội dung được định vị như thế nào trong trình duyệt và mức độ hiển thị của các phần tử khác nhau, vì vậy khi họ đang cố gắng đánh giá hoặc ưu tiên nội dung hoặc cân nhắc khả năng sử dụng, họ đang làm việc với cùng một sản phẩm mà khách truy cập.

Tương lai được kết xuất

Sự thay đổi độ trễ thời gian và tuyên bố kết xuất trước từ Mueller đặt chữ viết lên tường.

Lập chỉ mục như chúng tôi nghĩ nếu nó có khả năng trở thành một bước không liên quan về mặt chức năng từ góc độ SEO, với việc kết xuất thực hiện ở giai đoạn đầu khi có liên quan đến việc khám phá nội dung web.

Trong bài viết này, chúng tôi đã cố gắng đề cập một cách rộng rãi về kết xuất là gì.

Điều này có thể để lại cho bạn một số câu hỏi. Và nó nên.

Để trả lời những điều đó, tôi sẽ hướng bạn đến một số tài nguyên quan trọng.

Tôi không thể giới thiệu đủ theo các liên kết bên dưới:

  • Giới thiệu về kết xuất của SEO bởi Jamie Alberico
  • Bí ẩn SEO với Martin Splitt
  • Kết xuất Tuyên ngôn SEO của Bartosz Góralewicz
  • Hiểu Kiến thức Cơ bản về SEO JavaScript của Google (Nâng cao hơn một chút nhưng vẫn dễ hiểu)

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *