Duplicate Content Là Gì? Nguyên Nhân Và Giải Pháp Khắc Phục Duplicate Content
Tác giả: EQVN.NET | Chuyên mục: SEO | Ngày cập nhật: 20 - 04 - 2022
Chia sẻ bài viết này:
Duplicate content là một trong những vấn đề thu hút nhiều sự quan tâm của những người làm SEO. Duplicate content xảy ra khi có sự trùng lặp nội dung giữa các URL. Kết quả là các công cụ tìm kiếm sẽ khó có thể xác định URL nào nên được hiển thị trong kết quả tìm kiếm. Điều này sẽ ảnh hưởng nghiêm trọng đến xếp hạng trang web của bạn. Bài viết dưới đây sẽ nêu ra những nguyên nhân dẫn đến duplicate content và các giải pháp cho vấn đề này. Hãy cùng EQVN tìm hiểu ngay nhé!
1. Duplicate Content là gì?
Duplicate content (nội dung trùng lặp) là những nội dung tương tự nhau hoặc hoàn toàn giống nhau trên cùng một trang web, hoặc thậm chí là trên những trang web khác nhau. Một website có số lượng lớn các nội dung trùng lặp sẽ tác động tiêu cực đến thứ hạng trên Google.
Đôi lúc, duplicate content là những nội dung giống nhau từng chữ một so với nội dung đã được đăng tải trên một trang khác. Ví dụ:
Nhưng đôi khi duplicate content cũng xảy ra đối với những nội dung gần tương tự với nội dung khác, mặc dù 2 phiên bản nội dung này vẫn có một vài điểm khác biệt.
2. Duplicate content ảnh hưởng đến SEO như thế nào?
Google không muốn xếp hạng các trang có nội dung bị trùng lặp. Vì thế, nếu các trang trên trang web của bạn không có nội dung khác biệt, nó sẽ ảnh hưởng đến thứ hạng trang web trên các công cụ tìm kiếm. Sau đây là ba vấn đề chính mà các trang có nhiều duplicate content sẽ gặp phải:
2.1. Ít lưu lượng truy cập tự nhiên hơn
Google không muốn xếp hạng các trang sử dụng nội dung được sao chép từ các trang khác trong chỉ mục của Google, kể cả các trang này nằm trên trang web của riêng bạn.
Giả sử bạn có ba trang trên web của mình với nội dung tương tự như sau:
Google không chắc chắn đâu là “trang gốc” trong ba trang này. Vì vậy, cả ba trang sẽ phải đấu tranh với nhau để xếp hạng trên các công cụ tìm kiếm.
2.2. Có nguy cơ nhận hình phạt từ Google
Google đã nói rằng duplicate content có nguy cơ sẽ nhận hình phạt hoặc bị hủy lập chỉ mục tất cả các trang trên cùng một trang web. Tuy nhiên, điều này hiếm khi xảy ra. Google chỉ thực sự áp dụng hình phạt đối với một trang web cố tình sao chép nội dung từ các trang web khác. Vì vậy, nếu bạn có các nội dung trùng lặp giữa các trang trên trang web của mình, bạn không cần phải lo lắng về hình phạt này.
2.3. Ít trang được lập chỉ mục hơn
Khi trang web của bạn xuất hiện nhiều duplicate content (đặc biệt là các trang web có nhiều trang, chẳng hạn như trang thương mại điện tử) thì sẽ gặp tình trạng một số trang trên trang web không được lập chỉ mục. Nguyên nhân là vì ngân sách thu thập thông tin đã bị lãng phí quá nhiều cho các nội dung trùng lặp.
3. Các nguyên nhân gây ra hiện tượng duplicate content
3.1. Duplicate content do sự cố kỹ thuật
3.1.1. Cấu hình của máy chủ web không hợp lệ sẽ dẫn đến việc có nhiều miền canonical
Giả sử bạn có một trang web có địa chỉ là https://www.example.com (có www). Nếu bạn không cấu hình chính xác máy chủ của mình, trang web của bạn vẫn có thể được truy cập thông qua biến thể https://example.com (không có www). Điều này sẽ gây ra hiện tượng trùng lặp về nội dung.
3.1.2. Các vấn đề liên quan đến cấu trúc URL
URL cần phải được nhập chính xác vì chúng có phân biệt chữ hoa và chữ thường. Nghĩa là khi một URL có một chữ cái viết hoa sai, nó sẽ được xem là một URL khác biệt so với URL lúc đầu xuất hiện dưới dạng các chữ thường không in hoa. Việc nhập dấu gạch chéo và dấu gạch chéo cuối dòng không đúng cũng sẽ gây ra lỗi.
3.1.3. Các vấn đề liên quan đến phân loại Tag và Category
Trong hệ thống quản lý nội dung (CMS), đôi khi một bài đăng có thể sẽ nằm trong nhiều category (danh mục) khác nhau. Ví dụ bạn có một trang bài viết “Duplicate content là gì?”. Bài viết này được bạn đặt trong danh mục “Các bài viết về SEO”. Bên cạnh đó, bạn cũng thêm bài viết này vào danh mục “Các bài viết nổi bật năm 2022” chẳng hạn. Nếu không chỉ định đâu là URL chính, thì tất cả các URL truy cập vào bài viết này sẽ được coi là trùng lặp.
3.1.4. Lỗi do trang hình ảnh
Các trình quản lý nội dung sẽ tự động tạo ra các trang riêng dành cho các tệp đính kèm hình ảnh. Đây là những trang chỉ hiển thị một hình ảnh mà không hiển thị thêm bất kỳ nội dung nào nữa. Những trang này giống nhau và được tạo tự động bởi CMS, khi đó sẽ dẫn đến tình trạng duplicate content.
3.1.5. Duplicate content xảy ra khi có nhiều bình luận trong một trang
Khi có quá nhiều người bình luận trong một bài đăng thì các bình luận này có thể được phân thành nhiều trang,ví dụ:
Những trang này sẽ hiển thị nội dung giống nhau, chỉ có một điểm khác biệt duy nhất là ở cuối trang sẽ hiển thị những bình luận khác nhau. Đây cũng là một nguyên nhân dẫn đến hiện tượng trùng lặp nội dung trên trang web của bạn.
3.1.6. Vấn đề liên quan đến việc sử dụng cùng một ngôn ngữ đối với các khu vực khác nhau
Ví dụ: bạn có một nội dung dành cho người dùng ở Mỹ và một nội dung khác dành cho người dùng ở Anh và Úc. Các nội dung đều giống nhau nhưng khu vực nhắm đến lại khác nhau. Điều này có thể sẽ gây ra duplicate content.
3.2. Duplicate content do sao chép nội dung
3.2.1. Landing page
Hầu hết các trang landing page rất giống với các bài viết gốc. Đôi khi, nó chỉ được chỉnh sửa một số từ để chèn các từ khóa cụ thể. Điều này cũng sẽ dẫn đến việc nội dung bị trùng lặp.
3.2.2. Các trang web khác sử dụng nội dung của bạn
Ngay sau khi bạn xuất bản bài viết của mình, các trang web khác có thể sử dụng thông tin mà bạn đã chia sẻ. Rắc rối xảy ra khi trang web của bạn xếp hạng thấp hơn các trang web này bởi vì họ có độ uy tín miền cao hơn. Khi đó, họ sẽ được xem là một nguồn uy tín hơn so với trang web của bạn, và họ được coi là tác giả ban đầu của bài viết.
3.2.3. Sử dụng nội dung của trang web khác
Việc sao chép nội dung sẽ không chỉ gây ra vấn đề về xếp hạng mà còn có thể dẫn đến mối quan hệ bất hòa giữa các chủ sở hữu trang web.
Đối với những nội dung được dịch từ ngôn ngữ này sang ngôn ngữ khác để phù hợp với vị trí mục tiêu bạn muốn nhắm đến thì sẽ không được coi là trùng lặp. Tuy nhiên, nếu các trang web này được dịch không chính xác thông qua một phần mềm hay công cụ nào đó thì các công cụ tìm kiếm có thể sẽ xem những nội dung này là những bản sao spam.
Việc hiển thị cùng một nội dung trên thiết bị di động và trên máy tính cũng sẽ không được xem là duplicate content. Google có một tập hợp các bot tìm kiếm khác nhau cho các trang web dành cho thiết bị di động, vì vậy nó sẽ không ảnh hưởng đến thứ hạng SEO của bạn.
4. Nội dung trùng lặp bao nhiêu thì có thể chấp nhận được?
Đây là một câu hỏi khó có câu trả lời chính xác vì thuật toán của Google liên tục thay đổi. Theo Matt Cutts của Google, có khoảng 25 đến 35% nội dung web được coi là duplicate content. Hơn nữa, Google cũng không phạt các trang web có nhiều nội dung trùng lặp trên trang.
Tuy nhiên, nếu toàn bộ trang web của bạn chứa nội dung trùng lặp mà không có thêm bất kỳ giá trị bổ sung nào, Google sẽ không cho phép bạn vượt lên trên các trang web khác. Không có tỷ lệ phần trăm chính xác về việc Google cho phép đối với nội dung trùng lặp, nhưng bạn cần chú ý những điều sau:
Bạn không nên mong đợi trang web của mình xếp hạng tốt trên Google nếu nó chứa nội dung có sẵn trên các trang web uy tín và lâu đời hơn. Hơn nữa, nếu bạn chỉ tạo nội dung tự động và không nỗ lực tăng giá trị cho nó, thì thứ hạng trang web sẽ khó nằm ở vị trí cao được. Nếu muốn xếp hạng ở vị trí hàng đầu, bạn cần đưa ra là một phiên bản văn bản hoặc nội dung độc nhất mang lại giá trị đáng kể.
5. Các giải pháp khắc phục duplicate content
5.1. Thực hiện canonical (chuẩn hóa) các URL
CMS cho phép bạn quản lý nội dung blog của mình thông qua các danh mục và thẻ. Khi người dùng thực hiện tìm kiếm bằng thẻ và danh mục, kết quả thường xuất hiện giống nhau. Do đó, bot có thể coi chúng là bản sao. Có ba phương pháp để triển khai thẻ canonical đối với những URL giống nhau:
- Lựa chọn URL ưu tiên, có thể có www hoặc không có www.
- Chỉ định canonical URL cho các trang của bạn. Hãy xác định đâu là trang gốc trong số các trang giống nhau. Đây là trang bạn mong muốn người đọc sẽ thấy khi truy cập vào trang web.
- Thực hiện chuyển hướng 301 để giảm thiểu tác động của duplicate content. Thông qua chuyển hướng 301, người dùng sẽ được chuyển hướng từ URL không được ưu tiên sang URL tiêu biểu và được ưu tiên hơn. Khi một bot gặp chuyển hướng 301, nó sẽ tìm kiếm tài nguyên gốc thông qua các trang nội dung trùng lặp. Trong trường hợp này, tất cả các URL không được ưu tiên sẽ được liên kết đến URL ưu tiên.
5.2. Sử dụng noindex
Sử dụng thẻ meta ngăn lập chỉ mục (noindex) để ngăn các công cụ tìm kiếm tạo chỉ mục cho các trang có nội dung trùng lặp.
5.3. Sử dụng hreflang
Như đã đề cập trước đó, những nội dung được dịch từ ngôn ngữ này sang ngôn ngữ khác sẽ không được xem là duplicate content. Tuy nhiên, đôi lúc các nội dung này vẫn có thể gặp vấn đề về trùng lặp nội dung. Để ngăn chặn điều đó, bạn cần thêm thẻ hreflang giúp các công cụ tìm kiếm xác định được đâu là phiên bản nội dung chính xác.
6. Kết luận
Đôi lúc các trang web sẽ gặp hiện tượng duplicate content không mong muốn. Nếu không khắc phục vấn đề này, nó sẽ có những tác động tiêu cực đối với SEO cũng như làm giảm thứ hạng của trang web trên các công cụ tìm kiếm. Bên cạnh đó, trang web của bạn cũng sẽ không được đánh giá cao bởi người đọc. Vì thế, bên cạnh các giải pháp khắc phục duplicate content được đề cập trong bài viết, bạn cũng cần phải thường xuyên kiểm tra trang web của mình để ngăn chặn các vấn đề về nội dung trùng lặp.
7. Cập nhật những kiến thức mới về Digital marketing
7.1. Theo dõi các bài viết trên website EQVN
Để cập nhật thêm thông tin, kiến thức bổ ích khác về triển khai Digital Marketing
7.2. Tham khảo khóa học
Đến với khóa học SEO tại EQVN, học viên nhận được những lợi ích gì?
- Cập nhật những kiến thức mới nhất về SEO
- Nắm vững cách thức nghiên cứu và phân loại từ khóa
- Xây dựng nội dung bài viết chuẩn SEO
- Biết cách sử dụng các công cụ hỗ trợ hoạt động SEO
- Xây dựng chiến lược SEO tổng thể và lập kế hoạch SEO
- Triển khai SEO Onpage và SEO Offpage một cách hiệu quả
Tham khảo thông tin chi tiết Khóa học SEO – Tối ưu công cụ tìm kiếm Google
7.3. Tìm hiểu tổng quan về SEO – Tối ưu công cụ tìm kiếm Google
Để cập nhật các kiến thức mới về SEO, bạn đọc có thể tham khảo tại Chuyên mục tổng hợp bài viết về SEO – Tối ưu hóa công cụ tìm kiếm
Series bài viết quan trọng:
- Tổng quan về SEO cho người mới
- Cách thức hoạt động của thuật toán Google (Google algorithm)
- Cách thu thập thông tin & Lập chỉ mục trên Google
:
EQVN là đơn vị tiên phong trong lĩnh vực đào tạo khóa học Digital Marketing từ năm 2009 và là đối tác chính thức của Facebook và Google. Với kinh nghiệm hơn 20 năm, chúng tôi sẽ cung cấp cho bạn những kiến thức Digital Marketing mới nhất và hữu ích nhất! Tìm hiểu thêm về EQVN tại đây nhé!
Chia sẻ bài viết này:

EQVN.NET - Đào tạo, tư vấn giải pháp & triển khai Digital Marketing
EQVN là đơn vị tiên phong trong lĩnh vực đào tạo Digital Marketing tại Việt Nam từ năm 2003. Là đối tác chính thức với Facebook, Google, Zalo và các đối khác trong ngành
Bài viết cùng chủ đề
Khi tối ưu hóa các công cụ tìm kiếm, có thể bạn đã nghe qua cụm từ “backlink”. Backlink là một yếu tố không thể…
Bạn có biết rằng Technical SEO đóng vai trò quan trọng trong việc tối ưu hóa hiệu suất của trang web của bạn trên các…
Tối ưu hóa công cụ tìm kiếm Google Maps luôn được các doanh nghiệp hết sức quan tâm vì đây là cách tuyệt vời để…
Trong SEO, việc xây dựng một hệ thống liên kết chất lượng là một phần tất yếu để tăng cường vị thế trên các công…
EQVN Blog – Bạn là người làm tối ưu hóa website với công cụ tìm kiếm (SEO)? Hay là webmaster? Vậy bạn đã biết gì…

ĐÀO TẠO, TƯ VẤN GIẢI PHÁP VÀ TRIỂN KHAI DIGITAL MARKETING
EQVN.NET
Được thành lập vào tháng 4 năm 2003 và bắt đầu đào tạo Digital Marketing vào năm 2009. Với mục tiêu, Hỗ trợ doanh nghiệp và các cá nhân nắm bắt cơ hội và khai thác tối đa ứng dụng của Internet vào hoạt động kinh doanh.
Liên hệ chúng tôi qua mạng xã hội
KHÓA HỌC NỔI BẬT
Cập nhật những thông tin hữu ích về Digital Marketing mỗi tuần