Причина, по якій з’явилася ця стаття

Не так давно мені попалася на очі одна широко відома стаття «Що таке Пейджранк», до якої більшість людей звертається, коли хоче з’ясувати для себе питання — що таке Пейджранк, і як він працює. Якщо чесно, то я і сам їй користувався. Однак, коли я писав Калькулятор ПэйджРанка, мені прийшло в голову, що ця стаття хибна з погляду вироблених обчислень. У ній використовується своя власна форма ПэйджРанка, яку автор називає «міні-ранк». Міні-ранк, з незрозумілих причин, використовує формулу, відмінну від Гуглівського ПэйджРанка, з-за чого результати обчислень стають неправильними.

Незважаючи на те, що в результаті написання цієї і наступної статей автор заперечує міні-ранк, оригінальна стаття про міні-ранці залишається в інтернеті. Тому, якщо вам відома стаття «Що таке Пейджранк», то краще про неї забути.

Що ж таке Пейджранк?

Пейджранк являє собою чисельне значення, яке відображає, наскільки значуща дана сторінка в інтернеті. Гугл вважає, що коли одна сторінка посилається на іншу, вона немов «віддає свій голос» за іншу сторінку. Тоді, чим більше голосів віддано за сторінку, тим важливіше ця сторінка повинна бути. Крім того, — і це важливо! — «віддані голоси» відрізняються за значимістю в залежності від того, «хто» голосує. Гугл підраховує важливість оцінюваної сторінки, виходячи з «голосів», відданих за неї. При цьому в процесі виробництва розрахунків Гугл враховує, наскільки важливий (вагою) кожен з відданих «голосів».

Таким чином, Пейджранк Гугла — це його власний спосіб визначення важливості оцінюваної сторінки. Це дуже важливо, тому що Пейджранк є одним з факторів, що визначають порядок виведення результатів пошуку. Це не єдиний фактор, який Гугл використовує для оцінки сторінок, але один з найважливіших.

Починаючи з цього моменту, ми будемо використовувати термін «Пейджранк» у скороченій формі як «PR».

Примітки:

Далеко не всі посилання враховуються Гуглом. Так, Гугл жорстко фільтрує посилання, наявні на відомих фермах посилань» (спеціально створених сукупностях веб-документів, штучно створених для збільшення «ваги» тих чи інших веб-ресурсів). Деякі посилання навіть призводять до «покарання» сторінки, на яку вони ведуть, зі сторони Гугла. Зрозуміло, що вебмайстра не можуть контролювати, які сайти посилаються на їх сайти, але вони повинні розуміти, які посилання вони самі проставляють на інші сайти. З цієї причини, посилання, проставлені в межах одного окремо взятого сайту, не можуть йому нашкодити, тоді як посилання, що ведуть назовні сайту, можуть бути «шкідливими», якщо вони ведуть на «покарані» сайти. Тому будьте обережні, коли ставите посилання на зовнішні ресурси. Якщо PR сайту становить 0, то це зазвичай відбувається в результаті покарання, і буде недалекоглядно проставляти посилання на такий сайт.

Розстановка внутрішніх посилань

Факт: Веб-сайт має максимальне значення ПэйджРанка, яке поширюється по його сторінках з допомогою внутрішніх посилань.

Максимальне значення ПэйджРанка сайту еквівалентно кількості сторінок на сайті, помноженому на одиницю. Воно збільшується входять ззовні посиланнями з інших сайтів і знижується йдуть зовні посиланнями на інші сайти. Зараз ми говоримо про значення ПэйджРанка для всього сайту і не зачіпаємо Пейджранк кожної індивідуальної сторінки. Ви не повинні брати мої доводи на віру, ви й самі можете прийти до того ж висновку, взявши олівець і аркуш паперу, і провівши невеликі розрахунки.

Факт: Максимальне значення ПэйджРанка сайту тим вище, чим більше кількість сторінок на цьому сайті.

Чим більше сторінок має сайт, тим вище його Пейджранк. І знову — ви можете прийти до такого ж висновку з олівцем і аркушем паперу. При цьому пам’ятайте, що до уваги беруться тільки ті сторінки, про існування яких Гугл знає.

Факт: Неграмотна розстановка внутрішніх посилань веде до зниження ПэйджРанка сайту, але сверхграмотная розстановка внутрішніх посилань не здатна його підвищити.

Погана постановка внутрішніх посилань знижує Пейджранк сайту, але не існує способу підвищити Пейджранк з допомогою внутрішніх посилань. Єдиний шлях підвищення ПэйджРанка — це отримання більшого числа входять ззовні посилань та/або збільшення кількості сторінок на сайті.

Застереження: Хоча я настійно рекомендую створювати нові сторінки і додавати їх на сайт, тим не менш, існують певні види сторінок, створювати і додавати категорично не можна. Це сторінки, повністю або частково потрапляють під визначення cookie-cutters» («відсікачі куків»). Гугл розпізнає їх як спам, що включає внутрішню систему тривоги не тільки по відношенню до самих цих сторінок, але і до сайту загалом. А закінчується все «покаранням» сайту в цілому. Нові сторінки повинні містити тільки якісний контент — це основна і найважливіша вимога.

Що ми будемо робити з цим «загальним» ПэйджРанком?

Тепер розглянемо деякі приклади обчислень, щоб зрозуміти, яким чином можна маніпулювати ПэйджРанком сайту. Однак, перш ніж зробити це, слід звернути увагу на той факт, що веб-сторінка включається в індекс Гугла тільки тоді, коли існує хоча б одна інша сторінка в інтернеті, яка на неї посилається. Так заявляє сам Гугл. Якщо сторінки немає в індексі Гугла, то ніякі посилання з неї не враховуються при виробництві розрахунків.

Насправді, ми можемо нехтувати цим фактом, в основному тому що інші документи на тему «Пояснення ПэйджРанка» також ним нехтують. Так, ось цей калькулятор працює в двох режимах: «простому» і «реальному». В «простому» режимі мається на увазі, що обчислення проводяться для сторінок, із яких знаходяться в індексі Гугла, незалежно від того, чи посилаються на них які-небудь інші сторінки. В «реальному» режимі розрахунки для сторінок, які не перебувають в індексі Гугла, не приймаються до уваги. Наступні нижче приклади відносяться до результатів, одержуваних у «простому» режимі.

Давайте уявимо собі сайт, що складається з трьох сторінок (сторінки A, B і C), на які не проставлені посилання ззовні цього сайту. Ми присвоїмо кожній сторінці початкове значення ПэйджРанка в 1, хоча, насправді, неважливо, з якого значення ми почнемо — з 1, 0 або з 99. Навіть якщо призначити цю цифру в кілька мільйонів, після ряду послідовних обчислювальних ітерацій кінцевий результат буде тим же самим. Просто, стартуючи з 1, нам знадобиться менша кількість ітерацій, ніж починаючи відлік з 0 або будь-якого іншого значення. Ви можете слідкувати за розрахунками з допомогою олівця і паперу, або використовувати калькулятор.

Максимальний Пейджранк сайту — це кількість ПэйджРанка всередині сайту. Ми маємо три сторінки, отже, максимальний Пейджранк для нього дорівнює 3.

На поточний момент, ні на одній з сторінок немає посилання на будь-яку іншу, і ніякі інші сторінки не посилаються на ці три. Якщо ви одноразово справите обчислення для кожної сторінки, ви отримаєте значення ПэйджРанка для кожної з них, рівне 0.15. Абсолютно неважливо, яка кількість обчислювальних ітерацій ви пройдете — Пейджранк кожної сторінки буде залишатися рівним 0.15. Загальний Пейджранк сайту буде становити 0.45. хоча в ідеалі може дорівнювати 3. Сайт серйозним чином втрачає більшу частину свого потенційно можливого ПэйджРанка.

Приклад 1

Тепер почнемо знову з кожної сторінки, якій присвоєно PR 1. Поставимо посилання зі сторінки A на сторінку B і проведемо обчислення знову для кожній із сторінок. Ось що ми отримаємо:

Сторінка A = 0.15
Сторінка B = 1
Сторінка C = 0.15

Сторінка A «проголосувала» за сторінку B і, в результаті, Пейджранк сторінки B збільшився. Це непогано виглядає сторінки B, але лише в першій ітерації — адже ми не взяли до уваги описану вище ситуацію з «Виверт-22». А тепер подивимось, як зміняться цифри після більшої кількості обчислювальних ітерацій.

Після 100 ітерацій маємо:

Сторінка A = 0.15
Сторінка B = 0.2775
Сторінка C = 0.15

Цей результат залишається непоганим для сторінки B, але вже не настільки хорошим, яким він був раніше. Отримані результати тепер виглядають більш реалістично. Таким чином, загальний Пейджранк сайту тепер становить 0.5775, що трохи краще, але все ж лише невелика частина того значення, яке може мати місце.

Примітка:

З технічної точки зору, ці результати невірні у зв’язку зі специфічним ставленням Гугла до так званих «dangling links» («звисаючим посиланнями»), але їх можна використовувати в якості прикладу розрахунків.

Приклад 2

Спробуємо іншу структуру посилань. Розмістимо на кожній з сторінок посилання на всі сторінки. Знову присвоїмо кожній з сторінок PR, рівний 1:

Сторінка A = 1
Сторінка B = 1
Сторінка C = 1

Тепер ми досягли максимуму. Неважливо, скільки обчислювальних ітерацій буде зроблено, — для кожної сторінки PR буде складати 1. Ті ж самі результати ми отримаємо при створенні циклічній посилальної структури (тобто коли A посилається на B, B посилається на C and C посилається на D). Подивіться, як це виглядає на калькуляторі.

Отриманий нами результат свідчить, що, завдяки поганій структурі посилань, дуже легко втратити Пейджранк, тоді як при розумній простановке посилань ми можемо досягти його максимально можливої величини. Але ми не ставимо собі за мету досягти ситуації, коли кожна сторінка на сайті буде мати однакову частку ПэйджРанка. Ми бажаємо, щоб одна або кілька сторінок мали велику частку ПэйджРанка за рахунок інших сторінок. До таких сторінок ми відносимо індексну сторінку, центральні смислові сторінки («hub pages») та сторінки, які оптимізовані під певні пошукові запити. Зараз ми маємо всього трьома сторінками, тому ми нарощуємо Пейджранк індексного сторінки — сторінки A. Це чудово ілюструє ідею перерозподілу ПэйджРанка.

Приклад 3

Тепер спробуємо вчинити наступним чином. Розмістимо на сторінці A посилання на B і C. Також на сторінках B і C розмістимо посилання на сторінку A. Почнемо розрахунки зі значення PR, рівного 1 для кожній із сторінок. Після першої ітерації отримуємо:

Сторінка A = 1.85
Сторінка B = 0.575
Сторінка C = 0.575

А після 100 ітерацій результат трансформується в:

Сторінка A = 1.459459
Сторінка B = 0.7702703
Сторінка C = 0.7702703

В обох випадках, загальне значення ПэйджРанка сайту становить 3 (це максимум), тобто нічого не втрачається. Крім того, в обох випадках наочно видно, що сторінка A має набагато більшу частку ПэйджРанка, ніж дві інші сторінки. Так відбувається тому, що сторінки B і C передають свої частки ПэйджРанка тільки сторінці A і ніяким іншим сторінкам. Іншими словами, ми отримали керований механізм передачі частки ПэйджРанка в ту область сайту, в яку ми хочемо.

Приклад 4

На закінчення, збережемо передує посилальну структуру, і додамо посилання зі сторінки C на сторінку B. Знову почнемо з PR, рівного 1 для всіх сторінок. Після першої ітерації отримаємо:

Сторінка A = 1.425
Сторінка B = 1
Сторінка C = 0.575

Порівняно з результатами першої ітерації з попереднього прикладу сторінка A втратила деяку частку ПэйджРанка, сторінка B трохи придбала, а сторінка C залишилася на тому ж самому рівні. Сторінка C тепер ділить свої «голоси» між сторінками A і B. Раніше ж сторінка A отримувала всі «голоси». Саме тому сторінка A втратила, а сторінка B — придбала. За результатами 100 обчислювальних ітерацій отримуємо:

Сторінка A = 1.298245
Сторінка B = 0.9999999
Сторінка C = 0.7017543

Коли пил нарешті осіла, сторінка C втратила трохи в своєму ПэйджРанке, оскільки, ділячи тепер «голоси» між A ів, замість того щоб віддавати їх все на A, сторінка A віддає сторінці C через посилання з A на C. Таким чином, додавання додаткової виходить назовні посилання зі сторінки викликає втрату частини ПэйджРанка цієї сторінки непрямим чином, якщо будь-яка зі сторінок, на яку поставлено посилання, повертає посилання назад. Якщо ж сторінки, на які проставлені посилання, не повертають посилання назад, то втрати ПэйджРанка сторінки не відбувається. Якщо уявити собі більш життєву ситуацію, коли посилання повертається непрямим чином (сторінка посилається на іншу сторінку, інша — на третю, і так далі, поки N-ва сторінка не поверне посилання на першу), то втрати ПэйджРанка першої сторінки незначні. Це не так важливо, якщо мова йде про внутрішні посилання на сайті, але набуває особливого значення, коли посилання ведуть назовні сайту.

Приклад 5: нові сторінки

Додавання нових сторінок на сайт являє собою важливий механізм підвищення загального ПэйджРанка сайту, оскільки кожна нова сторінка додає в середньому PR 1 до загального значення. Коли ми займаємося додаванням нових сторінок, їх новий Пейджранк може передаватися вже існуючим важливим сторінкам. Скористаємося калькулятором для демонстрації.

Давайте додамо три нові сторінки до структури, описаної нами в прикладі 3 [дивимося]. Отже, є три нові сторінки, але вони поки що особливо не впливають на ситуацію. Невелике збільшення загального ПэйджРанка, і по 0.15 на нову сторінку — це все що ми бачимо. А тепер давайте проставимо з них посилання на сайт.

Поставимо посилання з кожної з нових сторінок на важливу сторінку, у нашому випадку — на сторінку A [дивимося]. При цьому ми бачимо, що сумарний Пейджранк подвоївся, з 3 (коли не було нових сторінок) до 6. Крім того, і Пейджранк сторінки A також практично подвоївся.

Одна-єдина річ неправильна в нашій моделі. Нові сторінки — це «сироти». Вони не можуть потрапити в індекс Гугла, і тому не можуть додати ніякого ПэйджРанка сайту, і не можуть передати ніякої частки ПэйджРанка сторінці A. Кожна з них потребує, щоб отримати посилання хоча б з однією з інших сторінок. Якщо сторінка A — це важлива сторінка, то найкраща сторінка для розміщення таких посилань, це, звичайно ж, сторінка A [дивимося]. Ви можете скільки завгодно довго розважатися підбором варіантів розміщення посилань, але, з «точки зору» сторінки A, вона не вважає себе найкращим місцем для розміщення посилань.

Таким чином, постановка посилань з однієї сторінки на велику кількість сторінок, у разі, якщо ви заводите відразу багато нових сторінок, не є гарною ідеєю. В цьому випадку ви отримуєте розпорошення ПэйджРанка цієї важливої сторінки. Висока ймовірність, що на сайті присутні більше однієї важливої сторінки, тому можна використати простановку прямих і зворотних посилань між важливими і новими сторінками. Ви можете скористатися калькулятором, щоб випробувати декілька різних міні-моделей сайту з тим, щоб знайти найкраще розміщення посилань, яке забезпечує найкращі результати з точки зору рівня ПэйджРанка для важливих сторінок.

Висновок за прикладами

Ви наочно бачите, що, завдяки організації внутрішньої посилальної структури сайту, можливо забезпечити передачу ПэйджРанка окремих його сторінок. Внутрішні сторінки сайту слід створювати з урахуванням перерозподілу ПэйджРанка, але це працює лише в тому випадку, коли Гугл знає про їх існування. Тому слід будувати політику таким чином, щоб роботи Гугла своєчасно їх індексували.

Вхідні та вихідні посилання

Можна дати певні приклади, але набагато краще почитати про них нижче, і трохи побавитися з моделями, знову ж таки використовуючи вже знайомий нам калькулятор.

Питання

Коли одна сторінка містить безліч посилань на іншу сторінку, всі посилання враховуються?

Іншими словами, якщо сторінка A одноразово посилається на сторінку B і 3 рази на сторінку C, отримує сторінка C 3/4 частки діленого ПэйджРанка від сторінки A?

Концепція ПэйджРанка полягає в тому, що сторінка «віддає голос» за одну або більше сторінок. В оригінальному документі від Гугла, описує Пейджранк, нічого не говориться про «голосування» більш ніж однієї посиланням за одну сторінку. Така ідея підриває концепцію ПэйджРанка, і цілком виразно, якщо допустити, що вона справедлива, відкриває простір для маніпуляцій в області зміни пропорцій передачі «голосів» для ряду сторінок. Якщо вам потрібна посилання на важливу сторінку, додайте до неї кілька посилань на важливу сторінку для мінімізації негативного ефекту.

Оскільки нам не вдалося отримати від Гугла певної відповіді на цю тему, розумно припускати, що сторінка може передати іншій сторінці тільки один «голос», і що додаткові «голоси», які виходять з однієї сторінки, не враховуються.

Коли сторінка посилається сама на себе, чи враховується така посилання?

Повернемося знову до основної концепції. Вона полягає в тому, що сторінка може «голосувати» за інші сторінки. В оригінальному документі від Гугла нічого не сказано про те, що сторінки можуть віддавати свої «голоси» самі за себе. Тому така ідея суперечить концепції і, знову ж, відкриває простір для недобросовісних маніпуляцій результатами. З цих причин, розумно вважати, що сторінка не може голосувати сама за себе, і що такі посилання не враховуються.

«Звисаючі посилання являють собою такі посилання, які ведуть на сторінку, з якої немає жодної виходить посилання. Вони приносять шкоду моделі, оскільки незрозуміло, яким чином перерозподіляється їх вагу. А таких посилань — безліч. Часто ці звисають посилання ведуть на сторінки, які ми ще ніколи не завантажували. Оскільки звисають посилання не впливають на оцінку ПэйджРанка інших сторінок безпосереднім чином, ми просто видаляємо їх з системи до тих пір, поки всі розрахунки ПэйджРанка не будуть зроблені. Коли ж розрахунки завершені, всі величини ПэйджРанка відомі, ці посилання додаються в базу і вже не впливають на порядок речей істотним чином», — так звучить уривок з оригінального документа про ПэйджРанке, написаного засновниками Гугла Сергієм Бріном і Лоренсом Пейджем.

Отже, звисаюча посилання — це посилання, що веде на сторінку, яка не має виходять з неї посилань, або посилання на сторінку, яку Гугл не індексує. В обох випадках, Гугл видаляє таку посилання з бази відразу після початку процесу розрахунків ПэйджРанка, і повертає її незадовго до того, як розрахунок закінчується. Тоді вплив таких посилань на результати розрахунку ПэйджРанка мінімально.

Можливо, в цілях підвищення функціональності конкретного сайту, можна проставляти посилання на сторінки, які не мають вихідних посилань, причому робити це без втрат ПэйджРанка, але це небезпечно з точки зору зниження потенційного ПэйджРанка. Потенційне значення для цього сайту складає 5, оскільки він містить 5 сторінок, але без залучення сторінки E, сайт досягає лише значення 4.15.

А тепер проставимо посилання зі сторінки A на сторінку E і натиснемо Calculate. Зазначимо, що сумарне значення знижується досить достовірно. Однак, оскільки нова посилання є звисає, і буде видалена з розрахунків, ми можемо знехтувати новим сумарним значенням і вважати попереднє 4.15 правдою. Такий вплив корисних з точки зору функціональності звисаючих посилань. Вони не тягнуть за собою втрати сумарного ПэйджРанка.

Однак, дещо-що, тим не менш, втрачається, тому поставимо посилання зі сторінки E назад на сторінку A і натиснемо Calculate. Тепер ми маємо максимальне значення ПэйджРанка, яке можливе для 5 сторінок. Нічого не втрачено.

Незважаючи на те, що з точки зору зручності функціоналу непогано ставити посилання на сторінки сайту без їх повернення, це небезпечно з точки зору падіння ПэйджРанка. Саме тому завжди стежте за тим, щоб кожна сторінка всередині сайту посилалася щонайменше на одну сторінку в межах того ж самого сайту.