Phân trang thân thiện với SEO: Hướng dẫn đầy đủ về các phương pháp hay nhất

Trong hướng dẫn này, hãy tìm hiểu cách phân trang có thể ảnh hưởng đến SEO, ưu và nhược điểm của các tùy chọn xử lý phân trang và cách theo dõi KPI.

Phân trang trang web là một công cụ định hình thông minh. Nó được sử dụng trong các ngữ cảnh khác nhau, từ hiển thị các mục trên các trang danh mục, đến lưu trữ bài viết, đến trình chiếu thư viện và chuỗi diễn đàn.

Đối với các chuyên gia SEO, vấn đề không phải là liệu bạn có phải xử lý phân trang hay không, mà là khi nào.

Tại một thời điểm phát triển nhất định, các trang web cần phân chia nội dung trên một loạt các trang thành phần cho trải nghiệm người dùng (UX).

Công việc của chúng tôi là giúp các công cụ tìm kiếm thu thập thông tin và hiểu mối quan hệ giữa các URL này để chúng lập chỉ mục trang có liên quan nhất.

Theo thời gian, các phương pháp xử lý phân trang tốt nhất của SEO đã phát triển. Trên đường đi, nhiều huyền thoại đã tự trình bày như là sự thật. Nhưng không còn nữa.

Bài viết này sẽ:

  • Xoá bỏ những lầm tưởng xung quanh việc phân trang ảnh hưởng đến SEO như thế nào.
  • Trình bày cách tối ưu để quản lý phân trang.
  • Xem lại các phương pháp xử lý phân trang bị hiểu lầm hoặc phụ.
  • Điều tra cách theo dõi tác động KPI của việc phân trang.

Cách phân trang có thể làm tổn hại đến SEO

Có thể bạn đã đọc rằng phân trang có hại cho SEO.

Tuy nhiên, trong hầu hết các trường hợp, điều này là do thiếu cách xử lý phân trang chính xác, chứ không phải do sự tồn tại của bản thân phân trang.

Hãy xem xét các tệ nạn được cho là của phân trang và cách khắc phục các vấn đề SEO mà nó có thể gây ra.

Phân trang gây ra nội dung trùng lặp

Chỉnh sửa nếu phân trang được triển khai không đúng cách, chẳng hạn như có cả trang “Xem tất cả” và các trang được phân trang không có rel = canonical chính xác hoặc nếu bạn đã tạo trang = 1 ngoài trang gốc của mình.

Không chính xác khi bạn có phân trang thân thiện với SEO. Ngay cả khi thẻ H1 và thẻ meta của bạn giống nhau, nội dung trang thực tế sẽ khác. Vì vậy, nó không phải là sự trùng lặp.

Phân trang tạo ra nội dung mỏng

Hãy sửa nếu bạn đã chia một bài báo hoặc thư viện ảnh trên nhiều trang (để thúc đẩy doanh thu quảng cáo bằng cách tăng số lần xem trang), để lại quá ít nội dung trên mỗi trang.

Không chính xác khi bạn đặt mong muốn của người dùng dễ dàng tiêu thụ nội dung của bạn lên trên doanh thu quảng cáo biểu ngữ hoặc số lần xem trang tăng giả tạo. Đặt một lượng nội dung thân thiện với người dùng trên mỗi trang.

Phân trang pha loãng Tín hiệu xếp hạng

Chính xác. Phân trang khiến giá trị liên kết nội bộ và các tín hiệu xếp hạng khác, chẳng hạn như liên kết ngược và chia sẻ xã hội, bị phân chia trên các trang.

Nhưng có thể được giảm thiểu bằng cách chỉ sử dụng phân trang trong trường hợp cách tiếp cận nội dung một trang sẽ gây ra trải nghiệm người dùng kém (ví dụ: các trang danh mục thương mại điện tử). Và trên các trang như vậy, thêm càng nhiều mục càng tốt, mà không làm chậm trang đến mức đáng chú ý, để giảm số lượng trang được phân trang.

Phân trang sử dụng ngân sách thu thập thông tin

Đúng nếu bạn đang cho phép Google thu thập dữ liệu các trang được phân trang. Và có một số trường hợp bạn muốn sử dụng ngân sách đó.

Ví dụ: để Googlebot di chuyển qua các URL được phân trang để đến các trang nội dung sâu hơn.

Thường không chính xác khi bạn đặt xử lý thông số phân trang của Google Search Console thành “Không thu thập thông tin” hoặc đặt tệp robots.txt không cho phép, trong trường hợp bạn muốn tiết kiệm ngân sách thu thập thông tin của mình cho các trang quan trọng hơn.

Quản lý phân trang theo các phương pháp hay nhất về SEO

Sử dụng liên kết neo có thể thu thập thông tin

Để các công cụ tìm kiếm thu thập thông tin các trang được phân trang một cách hiệu quả, trang web phải có các liên kết cố định với các thuộc tính href đến các URL được phân trang này.

Đảm bảo rằng trang web của bạn sử dụng <a href=[your-paginated-url-hereosystem> để liên kết nội bộ đến các trang được phân trang. Không tải các liên kết cố định được phân trang hoặc thuộc tính href qua JavaScript.

Ngoài ra, bạn nên chỉ ra mối quan hệ giữa các URL thành phần trong một chuỗi được phân trang bằng các thuộc tính rel = ”next” và rel = ”prev”.

Có, ngay cả sau Tweet khét tiếng của Google rằng họ không còn sử dụng các thuộc tính liên kết này nữa.

Ngay sau đó, Ilya Grigorik đã làm rõ rằng rel = “next” / “prev” vẫn có thể có giá trị.

Google không phải là công cụ tìm kiếm duy nhất trong thị trấn. Đây là vấn đề của Bing.

Bổ sung liên kết rel = ”next” / “prev” bằng liên kết rel = ”canonical” tự tham chiếu. Vì vậy / category? Page = 4 nên rel = ”canonical” thành / category? Page = 4.

Điều này thích hợp vì việc phân trang thay đổi nội dung trang và bản sao chính của trang đó cũng vậy.

Nếu URL có các tham số bổ sung, hãy bao gồm các tham số này trong liên kết rel = ”prev” / “next”, nhưng không bao gồm chúng trong liên kết rel = ”canonical”.

Ví dụ:

<link rel = “next” href = “https://www.example.com/category?page=2&order=newest” />

<link rel = “canonical” href = “https://www.example.com/category?page=2” />

Làm như vậy sẽ chỉ ra mối quan hệ rõ ràng giữa các trang và ngăn ngừa khả năng trùng lặp nội dung.

Các lỗi thường gặp cần tránh:

  • Đặt các thuộc tính liên kết trong nội dung <body>. Chúng chỉ được hỗ trợ bởi các công cụ tìm kiếm trong phần <head> của HTML của bạn.
  • Thêm liên kết rel = ”prev” vào trang đầu tiên (còn gọi là trang gốc) trong chuỗi hoặc liên kết rel = ”next” vào trang cuối cùng. Đối với tất cả các trang khác trong chuỗi, cả hai thuộc tính liên kết phải có mặt.
  • Hãy coi chừng URL chuẩn của trang gốc của bạn. Rất có thể trên? Page = 2, rel = prev phải liên kết đến trang chuẩn, không phải a? Page = 1.

Mã <head> của một sê-ri dài bốn trang sẽ trông giống như sau:

Một thẻ phân trang trên trang gốc, trỏ đến trang tiếp theo trong chuỗi.

<link rel = “next” href = “https://www.example.com/category?page=2 ″>

<link rel = “canonical” href = “https://www.example.com/category”>

Hai thẻ phân trang trên trang 2.
<link rel = “prev” href = “https://www.example.com/category”>
<link rel = “next” href = “https://www.example.com/category?page=3 ″>
<link rel = “canonical” href = “https://www.example.com/category?page=2”>

Hai thẻ phân trang trên trang 3.
<link rel = “prev” href = “https://www.example.com/category?page=2 ″>
<link rel = “next” href = “https://www.example.com/category?page=4 ″>
<link rel = “canonical” href = “https://www.example.com/category?page=3”>

Một thẻ phân trang trên trang 4, trang cuối cùng trong chuỗi phân trang.
<link rel = “prev” href = “https://www.example.com/category?page=3”>
<link rel = “canonical” href = “https://www.example.com/category?page=4”>

Sửa đổi các phần tử trên trang được phân trang

John Mueller nhận xét, “Chúng tôi không xử lý phân trang theo cách khác nhau. Chúng tôi coi chúng như những trang bình thường ”.

Có nghĩa là các trang được phân trang không được Google công nhận là một loạt các trang được hợp nhất thành một phần nội dung như họ đã khuyên trước đây. Mọi trang được phân trang đều đủ điều kiện để cạnh tranh với trang gốc để xếp hạng.

Để khuyến khích Google trả lại trang gốc trong SERPs và ngăn cảnh báo “Mô tả meta trùng lặp” hoặc “Thẻ tiêu đề trùng lặp” trong Google Search Console, hãy sửa đổi dễ dàng mã của bạn.

Nếu trang gốc có công thức:

Trang gốc SERP

Các trang được phân trang liên tiếp có thể có công thức:

trang phân trang SERP

Các tiêu đề và mô tả meta của trang URL được phân trang này có mục đích không tối ưu nhằm ngăn cản Google hiển thị các kết quả này, thay vì trang gốc.

Nếu ngay cả với những sửa đổi như vậy, các trang được phân trang vẫn được xếp hạng trong SERP, hãy thử các chiến thuật SEO trên trang truyền thống khác như:

Khử tối ưu hóa các thẻ H1 của trang được phân trang.

  • Thêm văn bản hữu ích trên trang vào trang gốc, nhưng không thêm các trang được phân trang.
  • Thêm hình ảnh danh mục với tên tệp được tối ưu hóa và thẻ alt vào trang gốc, nhưng không phải các trang được phân trang.
  • Không bao gồm các trang được phân trang trong Sơ đồ trang web XML
  • Mặc dù các URL được phân trang có thể lập chỉ mục về mặt kỹ thuật, nhưng chúng không phải là ưu tiên SEO để chi ngân sách thu thập thông tin.

Do đó, chúng không thuộc về sơ đồ trang web XML của bạn.

Xử lý các tham số phân trang trong Google Search Console

Nếu bạn có lựa chọn, hãy chạy phân trang thông qua một tham số thay vì URL tĩnh. Ví dụ:

example.com/category?page=2 qua example.com/category/page-2

Mặc dù không có lợi thế khi sử dụng cái này so với cái kia cho mục đích xếp hạng hoặc thu thập thông tin, nhưng nghiên cứu đã chỉ ra rằng Googlebot dường như đoán các mẫu URL dựa trên các URL động. Do đó, tăng khả năng phát hiện nhanh chóng.

Mặt khác, nó có thể gây ra bẫy thu thập dữ liệu nếu trang web hiển thị các trang trống cho các phỏng đoán không thuộc chuỗi phân trang hiện tại.

Ví dụ, giả sử một loạt bài có bốn trang.

URL có nội dung dừng tại www.example.com/category?page=4

Nếu Google đoán www.example.com/category?page=7 và một trang đang hoạt động nhưng trống được tải, bot sẽ lãng phí ngân sách thu thập thông tin và có khả năng bị mất vô số trang.

Đảm bảo mã trạng thái HTTP 404 được gửi cho bất kỳ trang nào được phân trang không thuộc chuỗi hiện tại.

Một ưu điểm khác của phương pháp tiếp cận tham số là khả năng định cấu hình tham số trong Google Search Console thành “Paginates” và bất kỳ lúc nào cũng có thể thay đổi tín hiệu để Google thu thập thông tin “Mọi URL” hoặc “Không có URL”, dựa trên cách bạn muốn sử dụng ngân sách thu thập thông tin. Không cần nhà phát triển!

Đừng bao giờ ánh xạ nội dung trang được phân loại với các mã nhận dạng phân mảnh (#) vì nó không thể thu thập thông tin hoặc lập chỉ mục và như vậy không thân thiện với công cụ tìm kiếm.

Các giải pháp SEO sai lầm, lỗi thời hoặc sai hoàn toàn cho nội dung được phân trang

Không làm gì cả

Google tin rằng Googlebot đủ thông minh để tìm trang tiếp theo thông qua các liên kết, vì vậy không cần bất kỳ tín hiệu rõ ràng nào.

Thông điệp cho SEO về cơ bản là, hãy xử lý phân trang bằng cách không làm gì cả.

Mặc dù có một cốt lõi sự thật cho câu nói này, nhưng không làm gì có nghĩa là bạn đang đánh bạc với SEO của mình.

Nhiều trang đã thấy Google chọn một trang được phân trang để xếp hạng trên trang gốc cho một truy vấn tìm kiếm.

Luôn luôn có giá trị khi đưa ra hướng dẫn rõ ràng cho trình thu thập thông tin về cách bạn muốn họ lập chỉ mục và hiển thị nội dung của bạn.

Canonicalize đến một Xem tất cả các trang

chuẩn để xem tất cả các trang

Trang Xem tất cả được lý tưởng để chứa tất cả nội dung trang thành phần trên một URL duy nhất.

Với tất cả các trang được phân trang có rel = ”canonical” đến trang Xem tất cả để củng cố các tín hiệu xếp hạng.

Lập luận ở đây là người tìm kiếm thích xem toàn bộ bài viết hoặc danh sách các mục danh mục trên một trang, miễn là nó tải nhanh và dễ điều hướng.

Khái niệm là nếu chuỗi phân trang của bạn có phiên bản Xem tất cả thay thế cung cấp trải nghiệm người dùng tốt hơn, các công cụ tìm kiếm sẽ ưu tiên trang này để đưa vào kết quả tìm kiếm thay vì trang phân đoạn có liên quan của chuỗi phân trang.

Điều này đặt ra câu hỏi – tại sao bạn lại đánh số trang ngay từ đầu?

Hãy làm cho điều này đơn giản.

Nếu bạn có thể cung cấp nội dung của mình trên một URL duy nhất trong khi cung cấp trải nghiệm người dùng tốt, thì không cần phân trang hoặc phiên bản Xem tất cả.

Ví dụ: nếu bạn không thể, một trang danh mục có hàng nghìn sản phẩm sẽ quá lớn và mất quá nhiều thời gian để tải, thì hãy phân trang. Xem tất cả không phải là tùy chọn tốt nhất vì nó sẽ không mang lại trải nghiệm người dùng tốt.

Việc sử dụng cả rel = ”next” / “prev” và phiên bản View All không có nghĩa vụ rõ ràng đối với các công cụ tìm kiếm và sẽ dẫn đến các trình thu thập thông tin bị nhầm lẫn.

Đừng làm điều đó.

Canonicalize đến trang đầu tiên

Một lỗi phổ biến là trỏ rel = ”canonical” từ tất cả các kết quả được phân trang đến trang gốc của chuỗi.

Một số người làm SEO thiếu hiểu biết đề xuất đây là một cách để hợp nhất quyền hạn trên toàn bộ các trang với trang gốc, nhưng điều này được thông tin sai.

Việc chuẩn hóa không chính xác cho trang gốc có nguy cơ khiến các công cụ tìm kiếm hiểu nhầm rằng bạn chỉ có một trang kết quả duy nhất.

Sau đó, Googlebot sẽ không lập chỉ mục các trang xuất hiện xa hơn trong chuỗi, cũng như xác nhận các tín hiệu cho nội dung được liên kết từ các trang đó.

Bạn không muốn các trang nội dung chi tiết của mình bị loại khỏi chỉ mục vì xử lý phân trang kém.

Mỗi trang trong một chuỗi được phân trang phải có trang chuẩn tự tham chiếu, trừ khi bạn sử dụng trang Xem tất cả.

Sử dụng rel = canonical không chính xác và rất có thể Googlebot sẽ bỏ qua tín hiệu của bạn.

Các trang được phân trang trong Noindex

Một phương pháp cổ điển để giải quyết các vấn đề về phân trang là một thẻ ngăn lập chỉ mục của rô bốt để ngăn nội dung đã phân trang được lập chỉ mục bởi các công cụ tìm kiếm.

Chỉ dựa vào thẻ noindex để xử lý phân trang sẽ dẫn đến bất kỳ tín hiệu xếp hạng nào từ các trang thành phần bị bỏ qua.

Tuy nhiên, vấn đề lớn hơn với phương pháp này là noindex lâu dài trên một trang cuối cùng sẽ khiến Google không theo dõi các liên kết trên trang đó.

Điều này có thể khiến nội dung được liên kết từ các trang được phân trang bị xóa khỏi chỉ mục.

Phân trang & Cuộn vô hạn hoặc Tải thêm

Một hình thức xử lý phân trang mới hơn là:

Cuộn vô hạn, nơi nội dung được tìm nạp trước và thêm trực tiếp vào trang hiện tại của người dùng khi họ cuộn xuống.
Tải nhiều hơn, nơi nội dung được hiển thị khi nhấp vào nút “xem thêm”.
Những cách tiếp cận này được người dùng đánh giá cao, nhưng Googlebot? Không nhiều lắm.

Googlebot không mô phỏng hành vi như cuộn xuống cuối trang hoặc nhấp để tải thêm. Có nghĩa là nếu không có trợ giúp, các công cụ tìm kiếm không thể thu thập dữ liệu tất cả nội dung của bạn một cách hiệu quả.

Để thân thiện với SEO, hãy chuyển đổi cuộn vô hạn của bạn hoặc tải thêm trang thành một chuỗi được phân trang tương đương, dựa trên các liên kết neo có thể thu thập thông tin với các thuộc tính href, có thể truy cập được ngay cả khi JavaScript bị tắt.

Khi người dùng cuộn hoặc nhấp chuột, hãy sử dụng JavaScript để điều chỉnh URL trong thanh địa chỉ với trang được phân trang thành phần.

Ngoài ra, hãy triển khai pushState cho bất kỳ hành động nào của người dùng tương tự như một lần nhấp hoặc chủ động lật một trang. Bạn có thể kiểm tra chức năng này trong bản demo được tạo bởi John Mueller.

Về cơ bản, bạn vẫn đang triển khai phương pháp hay nhất về SEO được đề xuất ở trên, bạn chỉ đang thêm chức năng trải nghiệm người dùng bổ sung lên trên cùng.

Không khuyến khích hoặc Chặn phân trang thu thập thông tin

Một số chuyên gia SEO khuyên bạn nên tránh hoàn toàn vấn đề xử lý phân trang bằng cách chỉ cần chặn Google thu thập dữ liệu các URL được phân trang.

Trong trường hợp như vậy, bạn muốn có các sơ đồ trang XML được tối ưu hóa tốt để đảm bảo các trang được liên kết qua phân trang có cơ hội được lập chỉ mục.

Có ba cách để chặn trình thu thập thông tin:

  • Cách lộn xộn: Thêm nofollow vào tất cả các liên kết trỏ đến các trang được phân trang.
  • Cách rõ ràng hơn: Sử dụng tệp robots.txt không cho phép.
  • Cách không cần nhà phát triển: Đặt thông số trang được phân trang thành “Phân trang” và để Google thu thập thông tin “Không có URL” trong Google Search Console.

Bằng cách sử dụng một trong những phương pháp này để ngăn cản các công cụ tìm kiếm thu thập thông tin từ các URL được phân trang, bạn:

Ngăn các công cụ tìm kiếm nhận ra các tín hiệu xếp hạng của các trang được phân trang.

  • Ngăn chặn việc chuyển giá trị liên kết nội bộ từ các trang được phân trang xuống các trang nội dung đích.
  • Cản trở khả năng của Google trong việc khám phá các trang nội dung đích của bạn.
  • Ưu điểm rõ ràng là bạn tiết kiệm ngân sách thu thập thông tin.

Không có rõ ràng đúng sai ở đây. Bạn cần quyết định ưu tiên cho trang web của mình là gì.

Cá nhân tôi, nếu tôi ưu tiên ngân sách thu thập thông tin, tôi sẽ làm như vậy bằng cách sử dụng xử lý phân trang trong Google Search Console vì nó có tính linh hoạt tối ưu để bạn thay đổi ý định.

Theo dõi tác động KPI của phân trang

Vì vậy, bây giờ bạn biết phải làm gì, làm thế nào để bạn theo dõi hiệu quả của việc xử lý phân trang tối ưu hóa?

Đầu tiên, thu thập dữ liệu điểm chuẩn để hiểu cách phân trang hiện tại của bạn đang ảnh hưởng đến SEO như thế nào.

Các nguồn cho KPI có thể bao gồm:

  • Tệp nhật ký máy chủ cho số lần thu thập thông tin trang được phân trang.
  • Site: toán tử tìm kiếm (ví dụ site: example.com inurl: page) để hiểu Google đã lập chỉ mục bao nhiêu trang được phân trang.
  • Báo cáo Phân tích Tìm kiếm của Google Search Console được lọc theo các trang có phân trang để hiểu số lần hiển thị.
  • Báo cáo trang đích của Google Analytics được lọc theo các URL được phân trang để hiểu hành vi trên trang web.
  • Nếu bạn gặp sự cố khi các công cụ tìm kiếm thu thập thông tin phân trang trang web của bạn để tiếp cận nội dung của bạn, bạn có thể muốn thay đổi các liên kết phân trang.

Khi bạn đã khởi chạy phương pháp xử lý phân trang theo phương pháp hay nhất, hãy truy cập lại các nguồn dữ liệu này để đo lường mức độ thành công của các nỗ lực của bạn.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *