Cách giải quyết các vấn đề về nội dung trùng lặp: Hướng dẫn đầy đủ

Các vấn đề về nội dung trùng lặp – dù là ngoại vi hay tại chỗ – đều có thể làm hỏng nỗ lực SEO của bạn. Hãy xem xét các vấn đề và giải pháp cho nội dung trùng lặp.

Trong lĩnh vực SEO của kiến ​​trúc trang web, chắc chắn rằng việc loại bỏ nội dung trùng lặp có thể là một trong những trận chiến khó khăn nhất.

Quá nhiều hệ thống quản lý nội dung và các nhà phát triển kém cỏi xây dựng các trang web hoạt động hiệu quả để hiển thị nội dung nhưng lại ít cân nhắc về cách nội dung đó hoạt động từ góc độ thân thiện với công cụ tìm kiếm.

Và điều đó thường để lại những tình huống khó xử về nội dung trùng lặp có hại cho SEO.

Có hai loại nội dung trùng lặp và cả hai đều có thể là một vấn đề:

  • Nhân bản tại chỗ là khi cùng một nội dung được sao chép trên hai hoặc nhiều URL duy nhất của trang web của bạn.
  • Thông thường, đây là thứ có thể được kiểm soát bởi quản trị viên trang web và nhóm phát triển web.
  • Trùng lặp ngoại tuyến là khi hai hoặc nhiều trang web xuất bản các phần nội dung giống hệt nhau. Đây là điều thường không thể kiểm soát trực tiếp mà phụ thuộc vào việc làm việc với bên thứ ba và chủ sở hữu của các trang web vi phạm.

Tại sao Nội dung trùng lặp lại là một vấn đề?

Cách tốt nhất để giải thích tại sao nội dung trùng lặp là xấu là trước tiên cho bạn biết tại sao nội dung độc đáo lại tốt.

Nội dung độc đáo là một trong những cách tốt nhất để tạo sự khác biệt với các trang web khác. Khi nội dung trên trang web của bạn là của bạn và của riêng bạn, bạn sẽ nổi bật. Bạn có một cái gì đó mà không ai khác có.

Mặt khác, khi bạn sử dụng cùng một nội dung để mô tả sản phẩm hoặc dịch vụ của mình hoặc có nội dung được đăng lại trên các trang khác, bạn sẽ mất lợi thế là duy nhất.

Hoặc, trong trường hợp nội dung trùng lặp tại chỗ, các trang riêng lẻ sẽ mất đi lợi thế là duy nhất.

Nhìn vào hình minh họa bên dưới. Nếu A đại diện cho nội dung được trùng lặp trên hai trang và từ B đến Q đại diện cho các trang liên kết đến nội dung đó, thì việc trùng lặp sẽ gây ra sự phân tách giá trị liên kết đang được chuyển.

Bây giờ, hãy tưởng tượng nếu tất cả các trang B-Q chỉ được liên kết đến trang A. Thay vì chia nhỏ giá trị mà mỗi liên kết cung cấp, thay vào đó, tất cả giá trị sẽ chuyển đến một URL duy nhất, điều này làm tăng cơ hội xếp hạng nội dung đó trong tìm kiếm.

minh họa nội dung trùng lặp

Cho dù tại chỗ hay bên ngoài, tất cả nội dung trùng lặp đều cạnh tranh với chính nó. Mỗi phiên bản có thể thu hút nhãn cầu và liên kết, nhưng không phiên bản nào sẽ nhận được đầy đủ giá trị mà nó sẽ nhận được nếu đó là phiên bản duy nhất và duy nhất.

Tuy nhiên, khi nội dung có giá trị và duy nhất có thể được tìm thấy trên không quá một URL ở bất kỳ đâu trên web, thì URL đó có cơ hội tốt nhất để được tìm thấy dựa trên việc nó là người thu thập các tín hiệu thẩm quyền duy nhất cho nội dung đó.

Bây giờ, hiểu được điều đó, chúng ta hãy xem xét các vấn đề và giải pháp cho nội dung trùng lặp.

Nội dung trùng lặp ngoại tuyến

Sao chép ngoại vi có ba nguồn chính:

  • Nội dung của bên thứ ba mà bạn đã xuất bản lại trên trang web của mình. Thông thường, đây là dạng mô tả sản phẩm chung chung do nhà sản xuất cung cấp.
  • Nội dung của bạn đã được xuất bản lại trên các trang web của bên thứ ba với sự chấp thuận của bạn. Điều này thường ở dạng phân phối bài báo hoặc có thể là phân phối bài báo ngược lại.
  • Nội dung mà ai đó đã đánh cắp từ trang web của bạn và xuất bản lại mà không có sự chấp thuận của bạn. Đây là nơi mà những kẻ phá hoại nội dung và kẻ trộm trở thành mối phiền toái.

Hãy xem xét từng cái.

Kẻ lừa đảo và kẻ trộm nội dung

Người sửa nội dung là một trong những kẻ vi phạm lớn nhất trong việc tạo nội dung trùng lặp. Những kẻ gửi thư rác và những thủ phạm bất chính khác xây dựng các công cụ lấy nội dung từ các trang web khác và sau đó tự xuất bản nội dung đó.

Phần lớn, các trang web này đang cố gắng sử dụng nội dung của bạn để tạo lưu lượng truy cập đến trang web của chính họ nhằm thu hút mọi người nhấp vào quảng cáo của họ. (Vâng, tôi đang nhìn bạn, Google!)

Rất tiếc, bạn không thể làm gì khác ngoài việc gửi báo cáo vi phạm bản quyền cho Google với hy vọng rằng nó sẽ bị xóa khỏi chỉ mục tìm kiếm của họ. Mặc dù vậy, trong một số trường hợp, việc gửi các báo cáo này có thể là một công việc toàn thời gian.

Một cách khác để xử lý nội dung này là bỏ qua nó, hy vọng Google có thể phân biệt được sự khác biệt giữa trang web chất lượng (của bạn) và trang web có nội dung cóp nhặt. Điều này bị ảnh hưởng và bỏ lỡ vì tôi đã thấy nội dung cóp nhặt xếp hạng cao hơn nguồn ban đầu.

Những gì bạn có thể làm để chống lại ảnh hưởng của nội dung cóp nhặt là sử dụng các liên kết tuyệt đối (URL đầy đủ) trong nội dung cho bất kỳ liên kết nào trỏ về trang web của bạn. Những nội dung ăn cắp đó thường không nhằm mục đích xóa sạch nội dung đó, vì vậy, ít nhất, khách truy cập có thể theo dõi lại bạn.

Bạn cũng có thể thử thêm một thẻ chuẩn trở lại trang nguồn (bất kể một phương pháp hay). Nếu những người tìm kiếm lấy bất kỳ mã nào trong số này, thẻ chuẩn ít nhất sẽ cung cấp tín hiệu để Google nhận ra bạn là người khởi tạo.

Phân phối bài viết

Vài năm trước, có vẻ như mọi SEO đang xuất bản lại nội dung của họ trên “ezines” như một chiến thuật xây dựng liên kết. Khi Google phá vỡ chất lượng nội dung và các kế hoạch liên kết, việc xuất bản lại đã giảm xuống.

Nhưng với đúng trọng tâm, nó có thể là một chiến lược tiếp thị vững chắc. Lưu ý, tôi đã nói “tiếp thị” chứ không phải chiến lược “SEO”.

Phần lớn, bất cứ khi nào bạn xuất bản nội dung trên các trang web khác, họ đều muốn có các quyền duy nhất đối với nội dung đó.

Tại sao? Bởi vì họ không muốn nhiều phiên bản của nội dung đó trên web làm giảm giá trị những gì nhà xuất bản cung cấp.

Nhưng khi Google đã tiến bộ hơn trong việc chỉ định quyền cho người tạo nội dung (tốt hơn, nhưng không hoàn hảo), nhiều nhà xuất bản cũng đang cho phép sử dụng lại nội dung trên các trang web cá nhân của tác giả.

Điều này có tạo ra vấn đề nội dung trùng lặp không? Nói cách khác, nó có thể, bởi vì vẫn còn hai phiên bản nội dung ở đó, mỗi phiên bản đều có khả năng tạo ra các liên kết.

Nhưng cuối cùng, nếu số lượng các phiên bản trùng lặp được giới hạn và kiểm soát, tác động cũng sẽ bị hạn chế. Trên thực tế, nhược điểm chính nằm ở tác giả hơn là nhà xuất bản thứ cấp.

Phiên bản nội dung được xuất bản đầu tiên thường sẽ được ghi nhận là phiên bản chuẩn. Trong tất cả, trừ một số trường hợp, những nhà xuất bản này sẽ nhận được nhiều giá trị hơn từ nội dung qua trang web của tác giả đăng lại nội dung đó.

Mô tả Sản phẩm Chung

Một số dạng phổ biến nhất của nội dung trùng lặp đến từ phần mô tả sản phẩm được sử dụng lại bởi mỗi (và hầu hết mọi) người bán.

Rất nhiều nhà bán lẻ trực tuyến bán các sản phẩm giống hệt như hàng nghìn cửa hàng khác. Trong hầu hết các trường hợp, mô tả sản phẩm do nhà sản xuất cung cấp, sau đó được tải lên cơ sở dữ liệu của từng trang web và được trình bày trên các trang sản phẩm của họ.

Mặc dù bố cục của các trang sẽ khác nhau nhưng phần lớn nội dung trang sản phẩm (mô tả sản phẩm) sẽ giống hệt nhau.

Giờ đây, hãy nhân lên với hàng triệu sản phẩm khác nhau và hàng trăm nghìn trang web bán những sản phẩm đó, và bạn có thể kết thúc bằng rất nhiều nội dung, nói một cách nhẹ nhàng, không độc đáo.

Làm cách nào để một công cụ tìm kiếm phân biệt giữa cái này hay cái khác khi một tìm kiếm được thực hiện?

Ở cấp độ phân tích nội dung thuần túy, điều đó không thể. Có nghĩa là công cụ tìm kiếm phải xem xét các tín hiệu khác để quyết định cái nào nên xếp hạng.

Một trong những tín hiệu này là các liên kết. Nhận được nhiều liên kết hơn và bạn có thể giành chiến thắng trong các cuộc rút thăm trúng thưởng nội dung nhạt nhẽo.

Nhưng nếu đối đầu với một đối thủ mạnh hơn, bạn có thể phải chiến đấu lâu dài trước khi có thể bắt kịp họ trong bộ phận xây dựng liên kết. Điều này đưa bạn trở lại tìm kiếm một lợi thế cạnh tranh khác.

Cách tốt nhất để đạt được điều đó là dành nhiều công sức hơn để viết các mô tả độc đáo cho từng sản phẩm. Tùy thuộc vào số lượng sản phẩm bạn cung cấp, đây có thể là một thách thức khá lớn, nhưng cuối cùng, nó sẽ rất xứng đáng.

Hãy xem hình minh họa bên dưới. Nếu tất cả các trang màu xám đại diện cho cùng một sản phẩm với các mô tả sản phẩm giống nhau, thì màu vàng thể hiện cùng một sản phẩm với một mô tả duy nhất.

Nếu bạn là Google, bạn muốn xếp hạng cao hơn cái nào?

Bất kỳ trang nào có nội dung độc đáo sẽ tự động có lợi thế vốn có so với nội dung tương tự nhưng trùng lặp. Điều đó có thể đủ hoặc có thể không đủ để xếp hạng đối thủ cạnh tranh của bạn, nhưng nó chắc chắn là cơ sở để trở nên nổi bật với không chỉ Google mà còn với cả khách hàng của bạn.

Nội dung trùng lặp tại chỗ

Về mặt kỹ thuật, Google xử lý tất cả các nội dung trùng lặp như nhau, vì vậy nội dung trùng lặp tại chỗ thực sự không khác gì ngoại vi.

Nhưng tại chỗ thì ít được tha thứ hơn vì đây là một loại trùng lặp mà bạn thực sự có thể kiểm soát được. Nó đang đưa các nỗ lực SEO của bạn vào chân ngôn ngữ.

Nội dung trùng lặp tại chỗ thường bắt nguồn từ kiến ​​trúc trang web xấu. Hoặc, nhiều khả năng, trang web phát triển không tốt!

Một kiến ​​trúc trang web mạnh mẽ là nền tảng cho một trang web mạnh mẽ.

Khi các nhà phát triển không tuân theo các phương pháp hay nhất thân thiện với tìm kiếm, bạn có thể mất cơ hội quý giá để đưa nội dung của mình lên thứ hạng do sự tự cạnh tranh này.

Có một số người phản đối sự cần thiết của kiến ​​trúc tốt, trích dẫn lời tuyên truyền của Google về cách Google có thể “tìm ra nó”. Vấn đề với điều đó là nó dựa vào Google để tìm ra mọi thứ.

Có, Google có thể xác định rằng một số nội dung trùng lặp nên được coi là một và giống nhau và các thuật toán có thể tính đến điều này khi phân tích trang web của bạn, nhưng điều đó không đảm bảo rằng họ sẽ làm như vậy.

Hay một cách khác để xem xét vấn đề đó là chỉ vì bạn biết ai đó thông minh không nhất thiết có nghĩa là họ sẽ có thể bảo vệ bạn khỏi sự ngu ngốc của chính bạn! Nếu bạn để mọi thứ cho Google và Google không thành công, bạn sẽ gặp rắc rối.

Bây giờ, hãy đi sâu vào một số vấn đề và giải pháp nội dung trùng lặp phổ biến tại chỗ.

Vấn đề: Sao chép phân loại sản phẩm

Có quá nhiều trang web thương mại điện tử bị loại trùng lặp này. Điều này thường xảy ra do hệ thống quản lý nội dung cho phép bạn sắp xếp các sản phẩm theo danh mục, trong đó một sản phẩm duy nhất có thể được gắn thẻ trong nhiều danh mục.

Bản thân điều đó không xấu (và có thể tốt cho khách truy cập), tuy nhiên, khi làm như vậy, hệ thống sẽ tạo một URL duy nhất cho mỗi danh mục mà một sản phẩm duy nhất hiển thị trong đó.

Giả sử bạn đang ở một trang web sửa chữa nhà và bạn đang tìm kiếm một cuốn sách về cách lắp đặt sàn phòng tắm. Bạn có thể tìm thấy cuốn sách mình đang tìm bằng cách đi theo bất kỳ đường dẫn điều hướng nào sau đây:

Trang chủ> ván sàn> phòng tắm> sách
Trang chủ> phòng tắm> sách> ván sàn
Trang chủ> sách> sàn> phòng tắm
Mỗi trong số này là một đường dẫn điều hướng khả thi, nhưng vấn đề phát sinh khi một URL duy nhất được tạo cho mỗi đường dẫn:

  • https://www.myfakesite.com/flooring/bathroom/books/fake-book-by-fake-author
  • https://www.myfakesite.com/bathroom/books/flooring/fake-book-by-fake-author
  • https://www.myfakesite.com/books/flooring/bathroom/fake-book-by-fake-author

Tôi đã thấy các trang web như thế này tạo tối đa mười URL cho mỗi sản phẩm, biến một trang web sản phẩm 5 nghìn thành một trang có 45 nghìn trang trùng lặp. Đó là vấn đề.

Nếu sản phẩm mẫu của chúng tôi ở trên tạo ra mười liên kết, thì những liên kết đó sẽ bị chia ra theo ba cách.

Trong khi đó, nếu trang của đối thủ cạnh tranh cho cùng một sản phẩm có cùng mười liên kết, nhưng chỉ đến một URL, thì URL nào có khả năng hoạt động tốt hơn trong tìm kiếm?

Không chỉ vậy, các công cụ tìm kiếm còn giới hạn băng thông thu thập thông tin của họ để họ có thể dành nó cho việc lập chỉ mục nội dung độc đáo và có giá trị.

Khi trang web của bạn có nhiều trang trùng lặp, rất có thể công cụ sẽ ngừng thu thập dữ liệu trước khi nó thậm chí còn được lập chỉ mục một phần nội dung duy nhất của bạn.

Điều này có nghĩa là hàng trăm trang có giá trị sẽ không có sẵn trong kết quả tìm kiếm và những trang được lập chỉ mục là bản sao cạnh tranh với nhau.

Giải pháp: Phân loại URL chính

Một cách khắc phục sự cố này là chỉ gắn thẻ các sản phẩm cho một danh mục duy nhất thay vì nhiều sản phẩm. Điều đó giải quyết được vấn đề trùng lặp, nhưng nó không nhất thiết là giải pháp tốt nhất cho người mua sắm vì nó loại bỏ các tùy chọn điều hướng khác để tìm (các) sản phẩm họ muốn. Vì vậy, hãy gạch đầu dòng đó ra khỏi danh sách.

Một tùy chọn khác là xóa hoàn toàn mọi loại phân loại khỏi URL. Bằng cách này, bất kể đường dẫn điều hướng được sử dụng để tìm sản phẩm, bản thân URL sản phẩm luôn giống nhau và có thể trông giống như sau:

  • https://www.myfakesite.com/products/fake-book-by-fake-author

Điều này khắc phục sự trùng lặp mà không thay đổi cách khách truy cập có thể điều hướng đến các sản phẩm. Nhược điểm của phương pháp này là bạn mất các từ khóa danh mục trong URL. Mặc dù điều này mang lại một lợi ích nhỏ cho tổng thể của SEO, nhưng mọi thứ đều có thể giúp ích.

Nếu bạn muốn đưa giải pháp của mình lên cấp độ tiếp theo, nhận được giá trị tối ưu hóa cao nhất có thể trong khi vẫn giữ được trải nghiệm người dùng đồng thời, hãy xây dựng một tùy chọn cho phép chỉ định từng sản phẩm cho danh mục “chính”, ngoài những sản phẩm khác.

Khi danh mục chính đang phát, sản phẩm có thể tiếp tục được tìm thấy thông qua nhiều đường dẫn điều hướng, nhưng trang sản phẩm được truy cập bằng một URL duy nhất sử dụng danh mục chính.

Điều đó có thể làm cho URL trông giống như sau:

  • https://www.myfakesite.com/flooring/fake-book-by-fake-authorOR
  • https://www.myfakesite.com/bathroom/fake-book-by-fake-authorOR
  • https://www.myfakesite.com/books/fake-book-by-fake-author

Giải pháp thứ hai này là giải pháp tổng thể tốt nhất, mặc dù nó cần một số lập trình bổ sung. Tuy nhiên, có một “giải pháp” tương đối dễ thực hiện hơn, nhưng tôi chỉ coi đó là một biện pháp hỗ trợ cho đến khi một giải pháp thực sự có thể được thực hiện.

Giải pháp hỗ trợ băng tần: Thẻ Canonical

Bởi vì tùy chọn phân loại chính không phải lúc nào cũng có sẵn cho các giải pháp CMS hoặc thương mại điện tử độc lập, nên có một tùy chọn thay thế sẽ “giúp” giải quyết vấn đề nội dung trùng lặp.

Điều này liên quan đến việc ngăn các công cụ tìm kiếm lập chỉ mục tất cả các URL không hợp quy. Mặc dù điều này có thể ngăn các trang trùng lặp ra khỏi chỉ mục tìm kiếm, nhưng nó không khắc phục được vấn đề chia tách thẩm quyền của trang. Mọi giá trị liên kết được gửi đến một URL không thể lập chỉ mục sẽ bị mất.

Giải pháp hỗ trợ dải tần tốt hơn là sử dụng các thẻ chuẩn. Điều này tương tự như việc chọn một danh mục chính nhưng thường yêu cầu ít, nếu có, lập trình bổ sung.

Bạn chỉ cần thêm một trường cho mỗi sản phẩm để cho phép bạn chỉ định một URL chuẩn, đây chỉ là một cách nói hoa mỹ, “URL bạn muốn hiển thị trong tìm kiếm”.

Thẻ chuẩn trông giống như sau:

  • <link rel = “canonical” href = “https://www.myfakesite.com/books/fake-book-by-fake-author” />

Bất chấp URL mà khách truy cập đang truy cập, thẻ chuẩn phía sau trên mỗi URL trùng lặp sẽ trỏ đến một URL duy nhất.

Về lý thuyết, điều này yêu cầu các công cụ tìm kiếm không lập chỉ mục các URL không hợp quy và chỉ định tất cả các chỉ số giá trị khác cho phiên bản chính tắc.

Điều này hầu hết đều hoạt động, nhưng trên thực tế, các công cụ tìm kiếm chỉ sử dụng thẻ chuẩn làm “tín hiệu”. Sau đó, họ sẽ chọn áp dụng hoặc bỏ qua nó khi họ thấy phù hợp.

Bạn có thể có hoặc không nhận được tất cả quyền liên kết được chuyển đến đúng trang và bạn có thể giữ hoặc không giữ các trang không chính tắc ra khỏi chỉ mục.

Tôi luôn khuyên bạn nên triển khai thẻ chuẩn, nhưng vì thẻ này không đáng tin cậy, hãy coi nó là một trình giữ chỗ cho đến khi có thể triển khai giải pháp chính thức hơn.

Vấn đề: Sao chép URL dự phòng

Một trong những vấn đề cơ bản nhất về kiến ​​trúc trang web xoay quanh cách các trang được truy cập trong trình duyệt.

Theo mặc định, hầu hết mọi trang trong trang web của bạn đều có thể được truy cập bằng một URL hơi khác. Nếu không được chọn, mỗi URL dẫn đến cùng một trang có cùng nội dung chính xác.

Chỉ xem xét trang chủ, nó có thể được truy cập bằng bốn URL khác nhau:

http://site.com
http://www.site.com
https://site.com
https://www.site.com

Và khi xử lý các trang nội bộ, bạn có thể nhận được phiên bản bổ sung của mỗi URL bằng cách thêm dấu gạch chéo sau:

http://site.com/page
http://site.com/page/
http://www.site.com/page
http://www.site.com/page/
Vân vân.

Đó là tối đa tám URL thay thế cho mỗi trang! Tất nhiên, Google nên biết rằng tất cả các URL này nên được coi là một, nhưng URL nào?

Giải pháp: Chuyển hướng 301 & Tính nhất quán của Liên kết nội bộ

Ngoài thẻ chuẩn mà tôi đã đề cập ở trên, giải pháp ở đây là đảm bảo bạn có tất cả các phiên bản thay thế của các URL chuyển hướng đến URL chuẩn.

Xin lưu ý, đây không chỉ là vấn đề về trang chủ. Vấn đề tương tự cũng áp dụng cho mọi URL trang web của bạn. Do đó, các chuyển hướng được triển khai phải mang tính toàn cầu.

Đảm bảo buộc từng chuyển hướng đến phiên bản chuẩn. Ví dụ: nếu URL chuẩn là https://www.site.com, mỗi chuyển hướng sẽ trỏ đến đó. Nhiều người mắc lỗi khi thêm các bước chuyển hướng bổ sung có thể trông giống như sau:

Site.com> https://site.com> https://www.site.com
Site.com> www.site.com> https://www.site.com

Thay vào đó, các chuyển hướng sẽ trông như thế này:

http://site.com> https://www.site.com/
http://www.site.com> https://www.site.com/
https://site.com> https://www.site.com/
https://www.site.com> https://www.site.com/
http://site.com/> https://www.site.com/
http://www.site.com/> https://www.site.com/
https://site.com/> https://www.site.com/

Bằng cách giảm số lượng bước nhảy chuyển hướng, bạn tăng tốc độ tải trang, giảm băng thông máy chủ và ít xảy ra sự cố hơn.

Cuối cùng, bạn cần đảm bảo rằng tất cả các liên kết nội bộ trong trang web cũng trỏ đến phiên bản chuẩn.

Mặc dù chuyển hướng sẽ giải quyết được vấn đề trùng lặp, nhưng chuyển hướng có thể không thành công nếu có sự cố xảy ra trên máy chủ hoặc phía triển khai của mọi thứ.

Nếu điều đó xảy ra, ngay cả tạm thời, chỉ có các trang chuẩn được liên kết nội bộ có thể giúp ngăn chặn sự gia tăng đột ngột của các vấn đề nội dung trùng lặp xuất hiện.

Vấn đề: Tham số URL & Chuỗi truy vấn

Cách đây nhiều năm, việc sử dụng ID phiên đã tạo ra một vấn đề lớn về nội dung trùng lặp đối với người làm SEO.

Tuy nhiên, công nghệ ngày nay đã làm cho tất cả các ID phiên trở nên lỗi thời, nhưng một vấn đề khác đã phát sinh cũng tồi tệ không kém, nếu không muốn nói là tệ hơn: tham số URL.

Các tham số được sử dụng để lấy nội dung mới từ máy chủ, thường dựa trên một hoặc nhiều bộ lọc hoặc các lựa chọn đang được thực hiện.

Hai ví dụ bên dưới hiển thị các URL thay thế cho một URL: site.com/shirts/.

URL đầu tiên hiển thị những chiếc áo sơ mi được lọc theo màu sắc, kích cỡ và kiểu dáng, URL thứ hai hiển thị những chiếc áo sơ mi được sắp xếp theo giá, sau đó hiển thị một số sản phẩm nhất định trên mỗi trang,

Site.com/shirts/?color=red&size=small&style=long_sleeve
Site.com/shirts/?sort=price&display=12

Chỉ dựa trên các bộ lọc này, có ba URL khả thi mà các công cụ tìm kiếm có thể tìm thấy. Nhưng thứ tự của các thông số này có thể thay đổi dựa trên thứ tự mà chúng được chọn, có nghĩa là bạn có thể nhận được một số URL dễ truy cập hơn như sau:

Site.com/shirts/?size=small&color=red&style=long_sleeve
Site.com/shirts/?size=small&style=long_sleeve&color=red
Site.com/shirts/?display=12&sort=price

Và điều này:

Site.com/shirts/?size=small&color=red&style=long_sleeve&display=12&sort=price
Site.com/shirts/?display=12&size=small&color=red&sort=price
Site.com/shirts/?size=small&display=12&sort=price&color=red&style=long_sleeveVân vân.

Bạn có thể thấy rằng điều này có thể tạo ra rất nhiều URL, hầu hết trong số đó sẽ không kéo bất kỳ loại nội dung duy nhất nào.

Trong số các thông số trên, thông số duy nhất bạn có thể muốn viết nội dung bán hàng là phong cách. Phần còn thừa, không nhiều lắm.

Giải pháp: Tham số cho bộ lọc, không phải trang đích hợp pháp

Lập kế hoạch chiến lược điều hướng và cấu trúc URL của bạn là rất quan trọng để vượt qua các vấn đề nội dung trùng lặp.

Một phần của quá trình đó bao gồm hiểu sự khác biệt giữa việc có một trang đích hợp pháp và một trang cho phép khách truy cập lọc kết quả.

Và sau đó hãy đảm bảo xử lý những điều này cho phù hợp khi phát triển URL cho chúng.

URL trang đích (và trang chuẩn) sẽ giống như sau:

Site.com/shirts/long-sleeve/
Site.com/shirts/v-neck/
Site.com/shirts/collared/

Và các URL kết quả được lọc sẽ trông giống như sau:

Site.com/shirts/long-sleeve/?size=small&color=red&display=12&sort=price
Site.com/shirts/v-neck/?color=red
Site.com/shirts/collared/?size=small&display=12&sort=price&color=red

Với các URL của bạn được tạo đúng cách, bạn có thể thực hiện hai việc:

  • Thêm thẻ chuẩn chính xác (mọi thứ trước dấu “?” Trong URL).
  • Truy cập Google Search Console và yêu cầu Google bỏ qua tất cả các thông số như vậy.

Nếu bạn thường xuyên chỉ sử dụng các tham số để lọc và sắp xếp nội dung, bạn sẽ không phải lo lắng về việc vô tình yêu cầu Google không thu thập thông số có giá trị… vì không có tham số nào trong số đó.

Nhưng vì thẻ chuẩn chỉ là một tín hiệu nên bạn phải hoàn thành bước hai để có kết quả tốt nhất. Và hãy nhớ điều này chỉ ảnh hưởng đến Google. Bạn cũng phải làm như vậy với Bing.

Mẹo dành cho nhà phát triển chuyên nghiệp: Các công cụ tìm kiếm thường bỏ qua mọi thứ ở bên phải của ký hiệu “#” bảng Anh trong URL.

Nếu bạn lập trình điều đó vào mọi URL trước bất kỳ thông số nào, bạn sẽ không phải lo lắng về việc chuẩn chỉ là một giải pháp hỗ trợ băng tần:

Site.com/shirts/long-sleeve/#?size=small&color=red&display=12&sort=price
Site.com/shirts/v-neck/#?color=red
Site.com/shirts/collared/#?size=small&display=12&sort=price&color=red

Nếu bất kỳ công cụ tìm kiếm nào truy cập vào các URL ở trên, chúng sẽ chỉ lập chỉ mục phần chính tắc của URL và bỏ qua phần còn lại.

Vấn đề: Trang Đích Quảng cáo & Bản sao Thử nghiệm A / B

Không có gì lạ khi các nhà tiếp thị phát triển nhiều phiên bản nội dung tương tự, dưới dạng trang đích cho quảng cáo hoặc mục đích thử nghiệm A / B / đa lượng biến.

Điều này thường có thể mang lại cho bạn một số dữ liệu và phản hồi tuyệt vời, nhưng nếu các trang đó được mở cho các công cụ tìm kiếm thu thập dữ liệu và lập chỉ mục, nó có thể tạo ra các vấn đề về nội dung trùng lặp.

Giải pháp: NoIndex

Thay vì sử dụng thẻ chuẩn để trỏ về trang chính, giải pháp tốt hơn ở đây là thêm thẻ meta ngăn lập chỉ mục vào mỗi trang để ngăn chúng hoàn toàn nằm ngoài chỉ mục của công cụ tìm kiếm.

Nói chung, các trang này có xu hướng là trẻ mồ côi, không có bất kỳ liên kết trực tiếp nào đến chúng từ bên trong trang web. Nhưng điều đó không phải lúc nào cũng ngăn các công cụ tìm kiếm tìm thấy chúng.

Thẻ chuẩn được thiết kế để chuyển giá trị trang và quyền hạn sang trang chính, nhưng vì các trang này không được thu bất kỳ giá trị nào, nên ưu tiên sử dụng chúng ngoài chỉ mục.

Khi Nội dung trùng lặp không phải là (Phần lớn) là vấn đề

Một trong những lầm tưởng SEO phổ biến nhất là có một hình phạt nội dung trùng lặp.

Không có.

Ít nhất là không nhiều hơn một hình phạt cho việc không đổ xăng trong xe của bạn và để nó chạy rỗng.

Google có thể không tích cực trừng phạt nội dung trùng lặp, nhưng điều đó không có nghĩa là không có hậu quả tự nhiên xảy ra vì nội dung đó.

Nếu không có nguy cơ bị phạt, điều đó mang lại cho các nhà tiếp thị một chút linh hoạt hơn trong việc quyết định những hậu quả mà họ sẵn sàng sống chung.

Mặc dù tôi cho rằng bạn nên loại bỏ mạnh mẽ (không chỉ hỗ trợ băng tần) tất cả nội dung trùng lặp trên trang web, nhưng việc sao chép ngoại vi thực sự có thể tạo ra nhiều giá trị hơn là hậu quả.

Nhận được nội dung có giá trị được xuất bản lại bên ngoài trang web có thể giúp bạn xây dựng sự công nhận thương hiệu theo cách mà việc tự xuất bản nội dung đó không thể. Đó là bởi vì nhiều nhà xuất bản bên ngoài có lượng khán giả lớn hơn và phạm vi tiếp cận xã hội rộng lớn hơn.

Nội dung của bạn, được xuất bản trên trang web của riêng bạn có thể đạt tới hàng nghìn người theo dõi, nhưng được xuất bản ra bên ngoài, nó có thể lên tới hàng trăm nghìn người.

Nhiều nhà xuất bản mong đợi duy trì độc quyền đối với nội dung mà họ xuất bản, nhưng một số cho phép bạn sử dụng lại nội dung đó trên trang web của mình sau một thời gian chờ đợi ngắn. Điều này cho phép bạn có thêm sự xuất hiện trong khi cũng có cơ hội xây dựng lượng khán giả của riêng mình bằng cách xuất bản lại nội dung của bạn trên trang web của bạn vào một ngày sau đó.

Nhưng kiểu phân phối bài viết này cần được hạn chế để có thể mang lại hiệu quả cho bất kỳ ai. Nếu bạn đưa nội dung của mình ra hàng trăm trang web khác để được xuất bản lại, giá trị của nội dung đó sẽ giảm đi theo cấp số nhân.

Và thông thường, nó không giúp củng cố thương hiệu của bạn bởi vì các trang web sẵn sàng xuất bản nội dung trùng lặp hàng loạt có ít giá trị để bắt đầu.

Trong mọi trường hợp, hãy cân nhắc ưu và nhược điểm của việc nội dung của bạn được xuất bản ở nhiều nơi.

Nếu sự trùng lặp với nhiều thương hiệu lớn hơn giá trị thẩm quyền nhỏ hơn mà bạn nhận được với nội dung độc đáo trên trang web của mình, thì bằng mọi cách, hãy theo đuổi chiến lược xuất bản lại được đo lường.

Nhưng từ khóa ở đó được đo lường.

Điều bạn không muốn là trang web chỉ có nội dung trùng lặp.

Tại thời điểm đó, bạn bắt đầu cắt giảm giá trị mà bạn đang cố gắng tạo ra cho thương hiệu của mình.

Bằng cách hiểu các vấn đề, giải pháp và trong một số trường hợp, giá trị của nội dung trùng lặp, bạn có thể bắt đầu quá trình loại bỏ sự trùng lặp mà bạn không muốn và theo đuổi sự trùng lặp mà bạn làm.

Cuối cùng, bạn muốn xây dựng một trang web nổi tiếng với nội dung mạnh mẽ, độc đáo và sau đó sử dụng nội dung đó để đạt được giá trị cao nhất có thể.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *