Оригінальний алгоритм розрахунку PageRank був розроблений творцями Google Лоуренсом Пейджем і Сергієм Бріном. Алгоритм виглядає наступним чином:

PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

PR(A) — PageRank сторінки A,
PR(Ti) — PageRank сторінки Ti, яка посилається на сторінку A,
C(Ti) — кількість зовнішніх посилань сторінки Ti (лінків, які посилаються на інші сайту),
d — коефіцієнт дампа, що лежить в проміжку від 0 до 1.

PageRank не класифікує веб сайти як єдине ціле, а визначається для кожної сторінки окремо. Чим менше число зовнішніх посилань, рассположенных на сторінки Ti, тим більшу вагу вони мають.

d — коефіцієнт дампа (пом’якшувальний коефіцієнт), що визначає ймовірність того, що випадкових користувач, відвідавши сторінку Ti перейде по зовнішньому посиланню на сторінку A (як правило, випадкова величина).

Існує також інший алгоритм розрахунку PageRank:

PR(A) = (1-d) / N + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn))

де N — загальне число всіх сторінок Інтернету. Даний алгоритм не розходиться в корені з предоженным раніше. (1-d) / N — це математичне очікування, що визначає ймовірність переходу користувача сайту Ti на сторінку А.

Алгоритм розрахунку PageRank
Розглянемо приклад розрахунку PageRank сторінок A, B і C. При цьому А сторінка посилається на сторінку B, B посилається на сторінку C, а сторінки А і C — посилаються один на одного (наприклад, при обміні посиланнями).

Згідно алгоритму Пейджа і Бріна, коефіцієнт пом’якшення d зазвичай встановлюється 0.85, але для більш простого розрахунку встановимо його як 0.5.

Розрахуємо PageRank сторінок:

PR(A)= 0.5 + 0.5 PR(C)
PR(B)= 0.5 + 0.5 (PR(A)/ 2)
PR(C)= 0.5 + 0.5 (PR(A)/ 2 + PR(B))

Вирішуємо одержане рівняння, отримуємо:

PR(A)= 14/13 = 1.07692308
PR(B)= 10/13 = 0.76923077
PR(C)= 15/13 = 1.15384615

Очевидно, що сума PageRank сторінок дорівнює трьом, що повністю збігається з кількістю сторінок.

ОСТАВЬТЕ ОТВЕТ

Please enter your comment!
Please enter your name here