Thuật toán PageRank được xem là thuật toán nền tảng và mở đầu cho gã khổng lồ Google. Thuật toán này được Larry Page và Sergey Brin sáng tạo ra tại Đại Học Stanford. Vậy thuật toán PageRank là gì? Cách tính PageRank như thế nào? Liệu điểm PageRank có còn được sử dụng đến ngày nay? Cùng SEO Web Đà Nẵng tìm hiểu chi tiết qua bài viết sau đây.
Thuật toán PageRank là gì?
Thuật toán PageRank là một thuật toán được phát triển bởi Larry Page và Sergey Brin, những người sáng lập Google. Nó được sử dụng để xếp hạng các trang web trên Internet dựa trên mức độ quan trọng của chúng.
Ý tưởng cơ bản của PageRank là xem mỗi liên kết đến một trang web như là một phiếu bầu cho trang web đó. Mỗi liên kết từ một trang web khác đến một trang càng quan trọng, thì trang đích đó càng được coi là quan trọng. Quá trình tính toán PageRank diễn ra theo cách đệ quy, trong đó mỗi lần lặp lại, giá trị PageRank của các trang web được cập nhật dựa vào giá trị PageRank của các liên kết đi vào.
Từ việc tính toán quan hệ giữa các liên kết và các trang web, thuật toán PageRank có thể ước tính xem một trang web nào có khả năng xuất hiện cao hơn trong kết quả tìm kiếm của Google. Điều này đã giúp Google xây dựng hệ thống tìm kiếm hiệu quả và phổ biến như ngày nay.
Lịch sử ra đời và cập nhật của PageRank
Dưới đây là tổng quan nhanh về lịch sử Google PageRank:
- 1 tháng 4 năm 1998: Larry Page và Sergey Brin công bố “The Anatomy of a Large-Scale Hypertextual Web Search Engine” (Cấu trúc của một công cụ tìm kiếm Web quy mô lớn dựa trên siêu văn bản)
- 1 tháng 9 năm 1998: Larry Page và Sergey Brin nộp đơn xin cấp bằng phát minh cho PageRank đầu tiên
- 4 tháng 9 năm 1998: Google được thành lập
- 11 tháng 12 năm 2000: Google ra mắt thanh công cụ Google Toolbar
- 17 tháng 6 năm 2004: Google nộp đơn xin cấp bằng phát minh “reasonable surfer” (người sử dụng hợp lý)
- 12 tháng 10 năm 2006: Google nộp đơn xin cấp bằng phát minh “seed sets” (tập hạt giống)
- 8 tháng 3 năm 2016: Google thông báo về việc ngừng hoạt động của thanh công cụ Google Toolbar.
Thanh công cụ PageRank ra đời
Năm 2000, Google ra mắt Thanh công cụ của Google. Đây là một trong những giai đoạn quan trọng nhất trong lịch sử PageRank. Bởi vì nó cho phép người dùng xem điểm số của bất kỳ trang nào. Do đó, SEO trở nên phụ thuộc vào việc tăng PageRank như một cách để cải thiện thứ hạng.
Một lời giải thích đơn giản về cách tiếp cận của nhiều người làm SEO vào đầu những năm 2000 là mục tiêu của họ là có được càng nhiều liên kết càng tốt. Từ các trang web có PageRank cao nhất có thể. Điều này làm cho PageRank dễ dàng bị thao túng, với các mưu đồ liên kết trả tiền. Các liên kết được đặt ở những vị trí không tự nhiên và với số lượng lớn.
Tại sao Google lại loại bỏ thanh công cụ PageRank
Sau gần 15 năm, Google đã ngừng cập nhật Thanh công cụ của Google. (Bản cập nhật được xác nhận cuối cùng là vào tháng 2013 năm 2016.). Tất nhiên, điều này không có nghĩa là Google ngừng sử dụng PageRank như một phần của thuật toán. Chỉ là PageRank không còn là một số liệu công khai.
Tại sao Google ngừng sử dụng thanh công cụ PageRank?
Thay vì tập trung vào việc tạo ra giá trị cho người dùng, SEOer tập trung vào việc có được chỉ số PageRank từ các website cao hơn. Và tất nhiên, nếu điểm PageRank được công khai thì sẽ dễ dàng thao túng hơn. Google nhận ra rằng chính thanh công cụ PageRank là vấn đề. Chính vì vậy vào năm 2016, Google đã loại bỏ hoàn toàn thông tin về điểm PageRank của website.
Thuật toán Pagerank hoạt động như thế nào?
Dưới đây là đoạn trích nguyên bản trong bài báo của Sergey Brin và Larry Page.
We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. We usually set d to 0.85. There are more details about d in the next section. Also, C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:
“The Anatomy of a Large-Scale Hypertextual Web Search Engine,” Sergey Brin and Larry Page
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Note that the PageRanks form a probability distribution over web pages, so the sum of all web pages’ PageRanks will be one.
Tạm dịch:
Giả sử trang A có trang T1… Tn mà trỏ đến nó (tức là, là trích dẫn). Tham số d là hệ số giảm chấn có thể được đặt trong khoảng từ 0 đến 1. Chúng tôi thường đặt d thành 0,85. Có thêm chi tiết về d trong phần tiếp theo. Ngoài ra, C (A) được định nghĩa là số lượng liên kết đi ra khỏi trang A. PageRank của một trang A được đưa ra như sau:
PR (A) = (1-d) + d (PR (T1) / C (T1) + … + PR (Tn) / C (Tn))
Lưu ý rằng PageRanks tạo thành một phân phối xác suất trên các trang web, vì vậy tổng của tất cả các PageRanks của tất cả các trang web sẽ là một.
Nói một cách đơn giản hơn, PageRank của Trang B được tính bằng cách nhân PageRank của Trang A với 0,85. Đây được gọi là hệ số giảm chấn. Nếu trang B sau đó liên kết đến trang C, trang này sẽ nhận được 85% PageRank của B. (Bằng 72,25% PageRank của Page A). Nếu một trang web không có liên kết trỏ đến nó, trang đó không bắt đầu bằng PR0, mà là PR0.15.
Nhưng mọi thứ còn phức tạp hơn khi có nhiều hơn một link out trên một trang. Càng có nhiều link out trên một trang, sức mạnh của trang web càng bị pha loãng. Nói cách khác, nó có lợi hơn cho SEO khi một trang chỉ liên kết đến trang web của bạn. Thay vì rất nhiều trang web khác nhau.
Các yếu tố ảnh hưởng đến Pagerank
Dưới đây là các yếu tố ảnh hưởng trực tiếp đến PageRank bạn nên biết.
- Anchor Text
- Khả năng một liên kết được nhấp vào
- Internal link website
- Liên kết Nofollow
Ngoài các yếu tố kể trên, Google còn áp dụng hàng trăm yếu tố SEO để trả về SERP chính xác nhất với nhu cầu người dùng.
Ngày nay, các thuật toán Google càng phát triển. Công cụ tìm kiếm này không chỉ dự vào duy nhất PageRank để xếp hạng các website mà còn dựa vào các thuật toán khác như Google Panda, Google Penguin, Google Hummingbird, Google Caffeine hay BERT.
Thuật toán Google Pagerank có còn tồn tại không?
Chỉ vì không còn thanh công cụ cung cấp cho chúng ta điểm PageRank của trang web không có nghĩa là nó vẫn không được sử dụng.
Vào năm 2017, Gary Illyes của Google đã xác nhận trên Twitter rằng thuật toán vẫn sử dụng PageRank.
Chỉ vì không còn thanh công cụ cung cấp cho chúng ta điểm PageRank của trang web không có nghĩa là nó vẫn không được sử dụng.
John Mueller của Google đã xác nhận điều này một lần nữa vào năm 2020:
Tuy nhiên, thuật toán PageRank rất khác so với ban đầu. Như Matt Cutts của Google đã viết vào năm 2009.
"Mặc dù chúng tôi vẫn gọi nó là PageRank, khả năng tính toán danh tiếng dựa trên các liên kết của Google đã tiến bộ đáng kể trong những năm qua."
Matt Cutts
PageRank chưa bao giờ biến mất. Và hiểu cách thức hoạt động của nó chỉ có thể giúp bạn trở thành một SEO tốt hơn.
Như vậy, SEO Web Đà Nẵng đã giải thích chi tiết cho bạn đọc thuật toán PageRank là gì? Cách tính chỉ số PageRank cho website. Và giải đáp thắc mắc liệu thuật toán Google PageRank có còn được sử dụng đến ngày nay. Nếu có thông tin bổ ích, đừng ngần ngại bình luận xuống dưới để cùng trao đổi bạn nhé.
Nguồn bài viết: https://seoweb.danang.vn/thuat-toan-pagerank/?feed_id=192