"Trang trùng lặp người dùng chưa chọn trang chính tắc" là một thông báo về trạng thái lập chỉ mục trong Google Search Console. Vậy lỗi này vì sao lại xuất hiện? Cách khắc phục như thế nào? Cùng SEO Web Đà Nẵng đọc bài viết dưới đây để xử lý triệt để lỗi trang trùng lặp, người dùng chưa chọn trang chính tắc một cách hiệu quả.
Trang trùng lặp người dùng chưa chọn trang chính tắc là gì?
Trang trùng lặp, người dùng chưa chọn trang chính tắc: là một lỗi được thông báo trong Google Search Console khi mà Google phát hiện ra tồn tại nhiều hơn 1 url có cùng nội dung mà không được thông báo chuyển hướng hay canonical đúng cách. Google không biết lựa chọn Url nào để lập chỉ mục hay hiển thị trên SERP.
Các nguyên nhân và cách khắc phục lỗi này:
Dưới đây là một số nguyên nhân phổ biến và cách khắc phục cho lỗi trang trùng lặp người dùng chưa chọn trang chính tắc chi tiết từng trường hợp.
1. Lỗi do cài plugin AMP tối ưu trên mobile
AMP là viết tắt của Accelerated Mobile Pages, được dùng để tăng tốc độ tải trang web trên các thiết bị di động. AMP sử dụng một phiên bản giới hạn của HTML và JavaScript để giảm thiểu thời gian tải trang và cải thiện trải nghiệm người dùng trên điện thoại di động. Công nghệ này thường được sử dụng trong các trang tin tức, blogs và nội dung web đơn giản khác.
Khi cài plugin này sẽ tạo ra các url dạng:
https://seoweb.danang.vn/serp-la-gi/
https://seoweb.danang.vn/serp-la-gi/?amp=1
Thông thường các plugin AMP sẽ tự động set rel=canonical về link chính, để thông báo với Google link nào là link chính tắc. Nếu kiểm tra thấy liên kết AMP đã được set canonical về url chính tắc, bạn có thể bỏ qua thông báo này trong Google Search Console.
Trường hợp AMP không được thêm thẻ rel=canonical, bạn có thể làm theo hướng dẫn sau:
Để giải quyết vấn đề này, chúng tôi khuyên bạn nên thêm thông tin về trang AMP vào trang không phải AMP và ngược lại, ở dạng thẻ trong tệp
.
Đối với trang không phải AMP:
Đối với trang AMP:
Trường hợp website chỉ có duy nhất 01 trang AMP bạn phải chỉ định canonical về chính nó:
Lưu ý, thay url bằng url của chính website bạn nhé.
2. Trùng lặp do các Url động
Url động là url được tạo ra sau khi người dùng tìm kiếm hoặc lựa chọn. CMS tự động sinh ra liên kết phục vụ cho yêu cầu của người dùng. Nếu không được xử lý, các url này sẽ gây trùng lặp với nội dung chính của bạn.
Ví dụ:
Url động sinh ra do tìm kiếm nội bộ:
https://seoweb.danang.vn/?s=giao+dien+website+du+lich
Nếu không xử lý sẽ trùng lặp với url:
https://seoweb.danang.vn/
Url động sinh ra do bộ lọc của website:
https://seoweb.danang.vn/products?category=dresses&color=green
Nếu không xử lý sẽ trùng lặp với url:
https://seoweb.danang.vn/products
Với trường hợp url động sinh ra do tìm kiếm nội bộ tốt nhất bạn nên chặn dạng url này trong tệp robots.txt . Bởi vì hiện nay rất nhiều website cá độ, sex... đi tìm kiếm các website có url search index được và spam thương hiệu, url nhằm lấy tín hiệu từ các website lớn điều này gây quá tải máy chủ và ảnh hưởng đến trải nghiệm người dùng thực tế trên website.
Để chặn url tìm kiếm nội bộ, bạn thêm dòng code bên dưới vào file robots.txt:
Disallow: /?s=*
Tùy trường hợp cấu trúc url search của bạn như thế nào bạn có thể thay thế phù hợp nhé. Trường hợp không biết tạo và chỉnh sửa file robots.txt bạn có thể xem bài viết: "Cách tạo và chỉnh sửa file robots.txt" của chúng tôi.
Với url động sinh ra do bộ lọc website: Bạn nên yêu cầu bộ phận IT của công ty mình cài đặt thẻ rel="canonical" về url chính.
Ví dụ:
https://seoweb.danang.vn/products?category=dresses&color=green
Canonical về:
https://seoweb.danang.vn/products
3. Url trùng lặp do chọn nhiều danh mục cho một bài viết
Thông thường, mỗi bài viết sẽ thuộc một danh mục. Tuy nhiên vì một lý do nào đó bạn lại chọn 2 danh mục cho một bài viết. Và url bài viết có thông số danh mục thì sẽ xuất hiện lỗi trang trùng lặp, người dùng chưa chọn trang chính tắc.
Ví dụ:
Bài viết Serp là gì chúng tôi chọn 2 danh mục và trong url có thông số danh mục:
https://seoweb.danang.vn/kien-thuc-seo/serp-la-gi/
https://seoweb.danang.vn/tin-tuc/serp-la-gi/
Để khắc phục điều này, bạn nên chọn lại duy nhất 01 danh mục cho bài viết. Hoặc trường hợp bài viết thuộc 2 danh mục, bạn nên bỏ thuộc tính danh mục trong url. Điều này giúp url ngắn gọn chuẩn SEO hơn.
Plugin Rank Math SEO có hỗ trợ loại bỏ danh mục trong đường dẫn. Bạn có thểm tham khảo hướng dẫn dưới đây:
- Truy cập plugin Rank Math SEO
- Chọn General settings -> Chọn Links
- Trong mục Strip Category Base gạt thanh chọn để Enable thuộc tính này
- Quay lại url và kiểm tra xem đã loại bỏ thuộc tính Category chưa
4. Máy chủ phân phối cả giao thức http, https, www và non-www
Đây là trường hợp máy chủ của bạn phân phối nhiều hơn 1 giao thức trên website. Đây cũng được xem là lỗi technical nghiêm trọng khiến website không được lập chỉ mục và xếp hạng đúng url cần SEO.
http://seoweb.danang.vn/lap-chi-muc-google-index/
https://seoweb.danang.vn/lap-chi-muc-google-index/
http://www.seoweb.danang.vn/lap-chi-muc-google-index/
Bạn cần chỉ định duy nhất 1 giao thức cho toàn bộ url trên website. Để làm điều này bạn có thể tham khảo thêm đoạn code dưới đây vào file .htaccess
Chuyển hướng http sang https và www sang non-www
# 301 REDIRECT HTTP TO HTTPS AND WWW TO NON-WWW
RewriteEngine On
RewriteCond %HTTPS off [OR]
RewriteCond %HTTP_HOST ^www\. [NC]
RewriteCond %HTTP_HOST ^(?:www\.)?(.+)$ [NC]
RewriteRule ^ https://%1%REQUEST_URI [L,NE,R=301]
Chuyển hướng http sang https và non-www sang www
# 301 REDIRECT HTTP TO HTTPS AND NON-WWW TO WWW
RewriteEngine On
RewriteCond %HTTPS off [OR]
RewriteCond %HTTP_HOST !^www\. [NC]
RewriteCond %HTTP_HOST ^(?:www\.)?(.+)$ [NC]
RewriteRule ^ https://www.%1%REQUEST_URI [L,NE,R=301]
5. Lập chỉ mục link rss
RSS là nguồn cấp dữ liệu cho phép người dùng theo dõi các tin tức mới nhất trên một website thông qua nguồn cấp này. Các url của rss có dạng /feed/, mặc dù trước đây Google không thu thập và lập chỉ mục dạng url này. Nhưng gần đây SEO Web Đà Nẵng nhận thấy một số url của mình đã được thu thập và lập chỉ mục.
Ví dụ:
https://seoweb.danang.vn/mau-giao-dien-website/tin-tuc/feed/
Để ngăn chặn điều này làm ảnh hưởng đến ngân sách crawl của Bot Google, bạn có thể chặn lập chỉ mục các dạng url này trong file robots.txt bằng cách thêm đoạn mã sau vào file này:
Disallow: /feed/
Đoạn mã này giúp thông báo cho Google Bot không thu thập dữ liệu và xếp hạng cho các url chứa /feed/ trong thành phần. Điều này không làm ảnh hưởng đến nguồn cấp của người dùng nên bạn yên tâm nhé.
6. Bạn thực sự đã tạo ra 2 bài viết trùng lặp
Lỗi này xuất hiện khi thực sự bạn đã tạo ra 2 bài viết trùng lặp nội dung và url khiến Google bối rối không biết chọn url nào. Khi bạn submit url trong Google Search Console, công cụ này sẽ chỉ rõ cho bạn đâu là url chính tắc mà Bot Google tìm thấy.
Việc của bạn là phải xem xét xóa một url và redirect 301 về url chính bạn muốn SEO.
Từ khi Google ra mắt Báo cáo lập chỉ mục trang, các nhà quản trị website liên tục nhận được các thông báo lỗi trang không được lập chỉ mục. Tuy nhiên bạn nên nhớ rằng không phải tất cả các thông báo trong báo cáo đều là lỗi. Nếu không ảnh hưởng đến kết quả SEO bạn có thể bỏ qua không cần xem xét các báo cáo này. SEO Web Đà Nẵng cũng đã có series các bài viết liên quan đến các thông báo này như:
- Khắc phục lỗi: “Bị loại trừ bởi thẻ noindex”
- Khắc phục lỗi: Trang có lệnh chuyển hướng trong Google Search Console
- Khắc phục lỗi: Không tìm thấy (404)
- Sửa lỗi bài viết bị Google lược bỏ
Nếu bạn gặp phải các lỗi này, có thể tham khảo nhanh các hướng dẫn của chúng tôi.
Tổng kết
Cuối cùng, SEO Web Đà Nẵng đã hướng dẫn bạn cách khắc phục lỗi trang trùng lặp người dùng chưa chọn trang chính tắc. Nếu đã thử các phương pháp trên mà không thu được kết quả, bạn có thể liên hệ đội ngũ của chúng tôi để được hỗ trợ. Hoặc để lại bình luận ngay dưới bài viết này để được chúng tôi tư vấn nhé.
Nguồn bài viết: https://seoweb.danang.vn/trang-trung-lap-nguoi-dung-chua-chon-trang-chinh-tac/?feed_id=105