Google PageRank

PageRank (PR) je spôsob, akým Google meria dôležitosť stránky. Google predpokladá, že ak jedna stránka odkazuje na inú, hlasuje tým za jej dôležitosť. Takže, čím viac hlasov jedna stránka má, tým je dôležitejšia, má vyšší PageRank. Nejde však len o počet odkazov. Záleží aj na tom, aký PageRank a koľko odkazov má stránka, ktorá odkazuje.

Ako sa PageRank počíta?

Algoritmus PageRanku bol popísaný zakladeteľmi Googlu – Larry Page (odtiaľ ten názov PageRank = Pageovo hodnotenie) a Sergey Brin, v ich práci: The Anatomy of a Large-Scale Hypertextual Web Search Engine. Pôvodný vzorec vyzerá takto:

PR(Pi) = (1-d) + d.∑ (PR(Pj)/C(Pj))

Novšia verzia je mierne upravená, ale v zásade sa na princípe PageRanku nič nemení:

PR(Pi) = (1-d)/N + d.∑ (PR(Pj)/C(Pj)

  • PR(Pi) – PageRank i-tej stránky
  • d = damping faktor menší ako 1 a väčší ako nula, cca 0,8-0,9
  • P1, P2,…, Pn sú všetky stránky v indexe a teda N je počet stránok
  • ∑ = suma pre všetky Pj z M(Pi), kde M(Pi) je množina všetkých stránok odkazujúcich na danú stránku i
  • C(Pj) = počet odkazov na j-tej stránke

Ako je vidieť:

  1. PageRank sa neurčuje pre celý web, ale pre každú stránku zvlášť.
  2. PageRank stránky j sa neprenáša na stránku i celý, ale je podelený počtom odkazov na stránke j a ešte znížený o damping faktor d.
  3. PageRank stránky je určený na základe PageRankov stránok odkazujúcich na počítanú stránku.

Pre výpočet PR jednej stránky potrebujeme poznať všetky ostatné PR stránok, ktoré na ňu odkazujú. Preto výsledné PR sa počíta v niekoľkých kolách a prekvapivo, vypočítané hodnoty pomerne rýchlo po niekoľkých iteráciách konvergujú k reálnemu PR (odhaduje sa, že pre priradenie PageRanku celosvetovému webu je potrebných asi 100 iterácií).

Random Surfer Model = Model náhodného browsujúceho

PageRank vychádza z modelu náhodného browsujúceho. Určuje pravdepodobnosť, s akou sa používateľ, ktorý náhodne kliká po odkazoch, dostane na danú stránku X. No a potom pravdepodobnosť, s akou klikne na jeden odkaz vedúci na stránku Y, je 1 lomeno počet odkazov na stránke (1/C(Px)). Čiže PageRank (pravdepodobnosť), ktorý by sa mal presúvať na prekliknutú stránku Y je PR(Px)/C(Px). Avšak tento výraz je ešte znížený vynásobením damping faktorom d, kde (1-d) by sa dalo vysvetliť ako pravdepodobnosť, že browsujúci už neklikne na žiadnu ďalšiu stránku a teda, že stránka X bola posledná, ktorú navštívil. Ak spočítame všetky takéto pravdepodobnosti, dostaneme pravdepodobnosť (PRy), že náhodný browsujúci pristane na stránke Y.

Ako zistiť PageRank web stránky?

Pokiaľ hovoríme o PageRanku web stránky, môžeme myslieť na dve rozdielne veci. Jednak môžeme hovoriť o reálnom PageRanku (real PR) alebo o Toolbar PageRanku (TBPR – ToolBar PageRank alebo GTPR – Google Toolbar PageRank). Reálny PageRank je pravdepodobne dôležitý pre umiestnenie stránok vo výsledkoch hľadania. Lenže táto hodnota sa nedá nijak zistiť, Google túto informáciu nezverejňuje.

Google však prevádza reálny PageRank na škálu od 0 do 10 = Toolbar PageRank, ktorú zverejňuje vo svojom Toolbar-i. Reálny PageRank sa prevádza na toolbarový logaritmicky, čo teda znamená, že rozdiel medzi vyššími PR (PR8 vs. PR7) je väčší ako rozdiel medzi nižšími (PR3 vs. PR2).

Ako zvýšiť PageRank stránky?

Z uvedeného by to malo byť ihneď jasné, že PageRank sa zvyšuje získavaním spätných odkazov na stránku.