Duplicate Content Là Gì? Nguyên Nhân Và Giải Pháp Khắc Phục Duplicate Content

Tác giả: EQVN.NET | Chuyên mục: | Ngày cập nhật: 20 - 04 - 2022

Bài viết này hữu ích cho bạn không?
0 / 5 0

Your page rank:

Định nghĩa duplicate content

Chia sẻ bài viết này:

Duplicate content là một trong những vấn đề thu hút nhiều sự quan tâm của những người làm SEO. Duplicate content xảy ra khi có sự trùng lặp nội dung giữa các URL. Kết quả là các công cụ tìm kiếm sẽ khó có thể xác định URL nào nên được hiển thị trong kết quả tìm kiếm. Điều này sẽ ảnh hưởng nghiêm trọng đến xếp hạng trang web của bạn. Bài viết dưới đây sẽ nêu ra những nguyên nhân dẫn đến duplicate content và các giải pháp cho vấn đề này. Hãy cùng EQVN tìm hiểu ngay nhé! 

Đề mục nội dung

1. Duplicate Content là gì?

Duplicate content (nội dung trùng lặp) là những nội dung tương tự nhau hoặc hoàn toàn giống nhau trên cùng một trang web, hoặc thậm chí là trên những trang web khác nhau. Một website có số lượng lớn các nội dung trùng lặp sẽ tác động tiêu cực đến thứ hạng trên Google.

Đôi lúc, duplicate content là những nội dung giống nhau từng chữ một so với nội dung đã được đăng tải trên một trang khác. Ví dụ:

Ví dụ về duplicate content

Ví dụ về duplicate content có nội dung giống nhau y hệt (Nguồn: Backlinko)

Nhưng đôi khi duplicate content cũng xảy ra đối với những nội dung gần tương tự với nội dung khác, mặc dù 2 phiên bản nội dung này vẫn có một vài điểm khác biệt.

Nội dung tương tự gây ra duplicate content

Nội dung tương tự có thể gây ra duplicate content (Nguồn: Backlinko)

2. Duplicate content ảnh hưởng đến SEO như thế nào?

Google không muốn xếp hạng các trang có nội dung bị trùng lặp. Vì thế, nếu các trang trên trang web của bạn không có nội dung khác biệt, nó sẽ ảnh hưởng đến thứ hạng trang web trên các công cụ tìm kiếm. Sau đây là ba vấn đề chính mà các trang có nhiều duplicate content sẽ gặp phải:

2.1. Ít lưu lượng truy cập tự nhiên hơn

Google không muốn xếp hạng các trang sử dụng nội dung được sao chép từ các trang khác trong chỉ mục của Google, kể cả các trang này nằm trên trang web của riêng bạn.

Giả sử bạn có ba trang trên web của mình với nội dung tương tự như sau:

Ví dụ về các trang web có nội dung trùng lặp

Ba trang web có nội dung trùng lặp (Nguồn: Backlinko)

Google không chắc chắn đâu là “trang gốc” trong ba trang này. Vì vậy, cả ba trang sẽ phải đấu tranh với nhau để xếp hạng trên các công cụ tìm kiếm.

Trang web chứa duplicate content sẽ khó có thứ hạng cao

Các trang web có duplicate content phải đấu tranh với nhau để xếp hạng (Nguồn: Backlinko)

2.2. Có nguy cơ nhận hình phạt từ Google

Google đã nói rằng duplicate content có nguy cơ sẽ nhận hình phạt hoặc bị hủy lập chỉ mục tất cả các trang trên cùng một trang web. Tuy nhiên, điều này hiếm khi xảy ra. Google chỉ thực sự áp dụng hình phạt đối với một trang web cố tình sao chép nội dung từ các trang web khác. Vì vậy, nếu bạn có các nội dung trùng lặp giữa các trang trên trang web của mình, bạn không cần phải lo lắng về hình phạt này.

2.3. Ít trang được lập chỉ mục hơn

Khi trang web của bạn xuất hiện nhiều duplicate content (đặc biệt là các trang web có nhiều trang, chẳng hạn như trang thương mại điện tử) thì sẽ gặp tình trạng một số trang trên trang web không được lập chỉ mục. Nguyên nhân là vì ngân sách thu thập thông tin đã bị lãng phí quá nhiều cho các nội dung trùng lặp. 

Google từ chối index các duplicate content

Google từ chối lập chỉ mục các trang web có duplicate content (Nguồn: Backlinko)

3. Các nguyên nhân gây ra hiện tượng duplicate content 

3.1.  Duplicate content do sự cố kỹ thuật

3.1.1. Cấu hình của máy chủ web không hợp lệ sẽ dẫn đến việc có nhiều miền canonical

Giả sử bạn có một trang web có địa chỉ là https://www.example.com (có www). Nếu bạn không cấu hình chính xác máy chủ của mình, trang web của bạn vẫn có thể được truy cập thông qua biến thể https://example.com (không có www). Điều này sẽ gây ra hiện tượng trùng lặp về nội dung. 

3.1.2. Các vấn đề liên quan đến cấu trúc URL

URL cần phải được nhập chính xác vì chúng có phân biệt chữ hoa và chữ thường. Nghĩa là khi một URL có một chữ cái viết hoa sai, nó sẽ được xem là một URL khác biệt so với URL lúc đầu xuất hiện dưới dạng các chữ thường không in hoa. Việc nhập dấu gạch chéo và dấu gạch chéo cuối dòng không đúng cũng sẽ gây ra lỗi.

3.1.3. Các vấn đề liên quan đến phân loại Tag và Category

 Trong hệ thống quản lý nội dung (CMS), đôi khi một bài đăng có thể sẽ nằm trong nhiều category (danh mục) khác nhau. Ví dụ bạn có một trang bài viết “Duplicate content là gì?”. Bài viết này được bạn đặt trong danh mục “Các bài viết về SEO”. Bên cạnh đó, bạn cũng thêm bài viết này vào danh mục “Các bài viết nổi bật năm 2022” chẳng hạn. Nếu không chỉ định đâu là URL chính, thì tất cả các URL truy cập vào bài viết này sẽ được coi là trùng lặp.

3.1.4. Lỗi do trang hình ảnh

 Các trình quản lý nội dung sẽ tự động tạo ra các trang riêng dành cho các tệp đính kèm hình ảnh. Đây là những trang chỉ hiển thị một hình ảnh mà không hiển thị thêm bất kỳ nội dung nào nữa. Những trang này giống nhau và được tạo tự động bởi CMS, khi đó sẽ dẫn đến tình trạng duplicate content. 

3.1.5. Duplicate content xảy ra khi có nhiều bình luận trong một trang

Khi có quá nhiều người bình luận trong một bài đăng thì các bình luận này có thể được phân thành nhiều trang,ví dụ:

Nguyên nhân gây ra duplicate content

Nhiều bình luận trong một trang web có thể gây ra duplicate content

Những trang này sẽ hiển thị nội dung giống nhau, chỉ có một điểm khác biệt duy nhất là ở cuối trang sẽ hiển thị những bình luận khác nhau. Đây cũng là một nguyên nhân dẫn đến hiện tượng trùng lặp nội dung trên trang web của bạn.

3.1.6. Vấn đề liên quan đến việc sử dụng cùng một ngôn ngữ đối với các khu vực khác nhau 

Ví dụ: bạn có một nội dung dành cho người dùng ở Mỹ và một nội dung khác dành cho người dùng ở Anh và Úc. Các nội dung đều giống nhau nhưng khu vực nhắm đến lại khác nhau. Điều này có thể sẽ gây ra duplicate content. 

3.2. Duplicate content do sao chép nội dung

3.2.1. Landing page

Hầu hết các trang landing page rất giống với các bài viết gốc. Đôi khi, nó chỉ được chỉnh sửa một số từ để chèn các từ khóa cụ thể. Điều này cũng sẽ dẫn đến việc nội dung bị trùng lặp. 

3.2.2. Các trang web khác sử dụng nội dung của bạn

Ngay sau khi bạn xuất bản bài viết của mình, các trang web khác có thể sử dụng thông tin mà bạn đã chia sẻ. Rắc rối xảy ra khi trang web của bạn xếp hạng thấp hơn các trang web này bởi vì họ có độ uy tín miền cao hơn. Khi đó, họ sẽ được xem là một nguồn uy tín hơn so với trang web của bạn, và họ được coi là tác giả ban đầu của bài viết.

3.2.3. Sử dụng nội dung của trang web khác 

Việc sao chép nội dung sẽ không chỉ gây ra vấn đề về xếp hạng mà còn có thể dẫn đến mối quan hệ bất hòa giữa các chủ sở hữu trang web.

Đối với những nội dung được dịch từ ngôn ngữ này sang ngôn ngữ khác để phù hợp với vị trí mục tiêu bạn muốn nhắm đến thì sẽ không được coi là trùng lặp. Tuy nhiên, nếu các trang web này được dịch không chính xác thông qua một phần mềm hay công cụ nào đó thì các công cụ tìm kiếm có thể sẽ xem những nội dung này là những bản sao spam. 

Việc hiển thị cùng một nội dung trên thiết bị di động và trên máy tính cũng sẽ không được xem là duplicate content. Google có một tập hợp các bot tìm kiếm khác nhau cho các trang web dành cho thiết bị di động, vì vậy nó sẽ không ảnh hưởng đến thứ hạng SEO của bạn.

4. Nội dung trùng lặp bao nhiêu thì có thể chấp nhận được? 

Đây là một câu hỏi khó có câu trả lời chính xác vì thuật toán của Google liên tục thay đổi. Theo Matt Cutts của Google, có khoảng 25 đến 35% nội dung web được coi là duplicate content. Hơn nữa, Google cũng không phạt các trang web có nhiều nội dung trùng lặp trên trang.

Tuy nhiên, nếu toàn bộ trang web của bạn chứa nội dung trùng lặp mà không có thêm bất kỳ giá trị bổ sung nào, Google sẽ không cho phép bạn vượt lên trên các trang web khác. Không có tỷ lệ phần trăm chính xác về việc Google cho phép đối với nội dung trùng lặp, nhưng bạn cần chú ý những điều sau:

Bạn không nên mong đợi trang web của mình xếp hạng tốt trên Google nếu nó chứa nội dung có sẵn trên các trang web uy tín và lâu đời hơn. Hơn nữa, nếu bạn chỉ tạo nội dung tự động và không nỗ lực tăng giá trị cho nó, thì thứ hạng trang web sẽ khó nằm ở vị trí cao được. Nếu muốn xếp hạng ở vị trí hàng đầu, bạn cần đưa ra là một phiên bản văn bản hoặc nội dung độc nhất mang lại giá trị đáng kể.

5. Các giải pháp khắc phục duplicate content 

5.1. Thực hiện canonical (chuẩn hóa) các URL

Sử dụng thẻ canonical cho các URL

Triển khai thẻ canonical đối với những URL giống nhau (Nguồn: Backlinko)

CMS cho phép bạn quản lý nội dung blog của mình thông qua các danh mục và thẻ. Khi người dùng thực hiện tìm kiếm bằng thẻ và danh mục, kết quả thường xuất hiện giống nhau. Do đó, bot có thể coi chúng là bản sao. Có ba phương pháp để triển khai thẻ canonical đối với những URL giống nhau:

  • Lựa chọn URL ưu tiên, có thể có www hoặc không có www. 
  • Chỉ định canonical URL cho các trang của bạn. Hãy xác định đâu là trang gốc trong số các trang giống nhau. Đây là trang bạn mong muốn người đọc sẽ thấy khi truy cập vào trang web. 
  • Thực hiện chuyển hướng 301 để giảm thiểu tác động của duplicate content. Thông qua chuyển hướng 301, người dùng sẽ được chuyển hướng từ URL không được ưu tiên sang URL tiêu biểu và được ưu tiên hơn. Khi một bot gặp chuyển hướng 301, nó sẽ tìm kiếm tài nguyên gốc thông qua các trang nội dung trùng lặp. Trong trường hợp này, tất cả các URL không được ưu tiên sẽ được liên kết đến URL ưu tiên.

Chuyển hướng 301

Thực hiện chuyển hướng 301 để giảm thiểu tác động của duplicate content (Nguồn: Backlinko)

5.2. Sử dụng noindex

Sử dụng thẻ meta ngăn lập chỉ mục (noindex) để ngăn các công cụ tìm kiếm tạo chỉ mục cho các trang có nội dung trùng lặp.

5.3. Sử dụng hreflang

Như đã đề cập trước đó, những nội dung được dịch từ ngôn ngữ này sang ngôn ngữ khác sẽ không được xem là duplicate content. Tuy nhiên, đôi lúc các nội dung này vẫn có thể gặp vấn đề về trùng lặp nội dung. Để ngăn chặn điều đó, bạn cần thêm thẻ hreflang giúp các công cụ tìm kiếm xác định được đâu là phiên bản nội dung chính xác.

6. Kết luận 

Đôi lúc các trang web sẽ gặp hiện tượng duplicate content không mong muốn. Nếu không khắc phục vấn đề này, nó sẽ có những tác động tiêu cực đối với SEO cũng như làm giảm thứ hạng của trang web trên các công cụ tìm kiếm. Bên cạnh đó, trang web của bạn cũng sẽ không được đánh giá cao bởi người đọc. Vì thế, bên cạnh các giải pháp khắc phục duplicate content được đề cập trong bài viết, bạn cũng cần phải thường xuyên kiểm tra trang web của mình để ngăn chặn các vấn đề về nội dung trùng lặp. 

7. Cập nhật những kiến thức mới về Digital marketing

7.1. Theo dõi các bài viết trên website EQVN

Để cập nhật thêm thông tin, kiến thức bổ ích khác về triển khai Digital Marketing

7.2. Tham khảo khóa học

Đến với khóa học SEO tại EQVN, học viên nhận được những lợi ích gì?

  • Cập nhật những kiến thức mới nhất về SEO
  • Nắm vững cách thức nghiên cứu và phân loại từ khóa
  • Xây dựng nội dung bài viết chuẩn SEO
  • Biết cách sử dụng các công cụ hỗ trợ hoạt động SEO
  • Xây dựng chiến lược SEO tổng thể và lập kế hoạch SEO
  • Triển khai SEO Onpage và SEO Offpage một cách hiệu quả

Tham khảo thông tin chi tiết Khóa học SEO – Tối ưu công cụ tìm kiếm Google

7.3. Tìm hiểu tổng quan về SEO – Tối ưu công cụ tìm kiếm Google

Để cập nhật các kiến thức mới về SEO, bạn đọc có thể tham khảo tại Chuyên mục tổng hợp bài viết về SEO – Tối ưu hóa công cụ tìm kiếm

 

Series bài viết quan trọng:

 

:

Bài viết này hữu ích cho bạn không?
0 / 5 0

Your page rank:

Chia sẻ bài viết này:

Giới thiệu về tác giả

EQVN là đơn vị tiên phong trong lĩnh vực đào tạo Digital Marketing tại Việt Nam từ năm 2003. Là đối tác chính thức với Facebook, Google, Zalo và các đối khác trong ngành

Bài viết cùng chủ đề

Những điều SEOER cần biết về thuật toán Google (Google algorithm)

Cách thức hoạt động của thuật toán Google (Google algorithm)

Một trong những điều khiến cộng đồng Seoer luôn trong tình trạng khốn khổ, “đứng ngồi không yên” không đâu xa lạ đó chính là thuật toán Google (Google algorithm). …

định nghĩa search intent

Search Intent Là Gì Và Làm Thế Nào Để Tối Ưu Search Intent Hiệu Quả?

Nếu việc tối ưu SEO các bài viết của bạn vẫn chưa hiệu quả thì có thể nội dung đó chưa đáp ứng được search intent (ý định tìm kiếm).…

copyright là gì?

Bản quyền – một cái nhìn toàn diện

Trong bài viết này, chúng ta sẽ đề cập đến vấn đề bản quyền trên Google với góc nhìn toàn diện. Bên cạnh đó, chúng ta sẽ đề cập đến…

SEO hình ảnh

SEO Hình Ảnh Là Gì? Cách Thức Tối Ưu Hình Ảnh Hiệu Quả Bền Vững

SEO hình ảnh là một hoạt động quan trọng và ảnh hưởng trực tiếp đến kết quả SEO của trang web. Cũng giống như nội dung bạn viết trên trang…

Tổng quan SEO Google

Tổng quan về SEO cho người mới

SEO hay làm SEO Google là gì ? Google là công cụ tìm kiếm lớn nhất thế giới, thật dễ hiểu khi phần lớn lượt truy cập vào website sẽ…

logo eqvn

Đào tạo, tư vấn giải pháp và
triển khai Digital Marketing

Được thành lập vào tháng 4 năm 2003 và bắt đầu đào tạo Digital Marketing vào năm 2009. Với mục tiêu, Hỗ trợ doanh nghiệp và các cá nhân nắm bắt cơ hội và khai thác tối đa ứng dụng của Internet vào hoạt động kinh doanh.

Liên hệ chúng tôi qua mạng xã hội

Dịch vụ Digital Marketing

dịch vụ DM2@3x-8
Dịch vụ Digital Marketing

Nội dung cơ bản đến nâng cao nhằm giúp bạn ứng dụng thành thạo các kênh truyền thông phổ biến trên Internet: Facebook, Google Ads, SEO...

seo
Dịch vụ SEO

Chương trình đem đến cho CEO, Quản lý ... giải pháp Quản trị trong hoạt động truyền thông số trong doanh nghiệp, như lập kế hoạch, đo lường,...

Khóa học Digital Marketing

digital marketing
Chuyên viên Digital Marketing

Nội dung cơ bản đến nâng cao nhằm giúp bạn ứng dụng thành thạo các kênh truyền thông phổ biến trên Internet: Facebook, Google Ads, SEO...

seo
Khóa học SEO

Chương trình có tính hệ thống cao, được thiết kế bởi các đối tác và chuyên gia đầu ngành. Giảng viên giàu kinh nghiệm thực tế, từ các Digital Agency tốt nhất tại Việt Nam. Cam kết chất lượnghỗ trợ triển khai sau đào tạo

inhouse
Đào tạo tại doanh nghiệp

Song song với các chương trình đào tạo tập trung về Digital Marketing, EQVN đặc biệt thiết kế riêng chương trình đào tạo tại chỗ dựa trên yêu cầu của doanh nghiệp (Inhouse Training).

Đăng ký tải tài liệu Tổng quan Digital Marketing cho người mới bắt đầu