PageRank bilaketa-tresna batek indexatutako dokumentuen (edo web orrialdeen) garrantziari balioa emateko erabiltzen den algoritmo sorta da. PageRank metodoa Google bilatzaileak erabiltzen du orrialde baten garrantzia zehazteko. Googleren fundatzaile Larry Page eta Sergey Brinek 1998an asmatu zuten metodo hau Stanfordeko Unibertsitatean.
PageRank sistema loturetan oinarritzen da balioa zehazteko. Googlek A orrialdeak B orrialderako duen lotura bat Ak Bri emandako boto bezala kontsideratzen du. Baina lotura kontuan izateaz gain, berau nondik datorren ere kontuan izaten du. Orrialde garrantzitsu baten jatorria baldin badu, bere pisua are handiagoa izango da.
Googleek 1999ko Urtarrilaren 9an erregistratu eta patentaturiko marka. Google deituriko bilaketa motorrak PageRank sistema erabiltzen du web orriak indexatzeko. Horrek ahalbidetzen duen algoritmoa Larry Page-ek (hemendik dator PageRank-eko izena) eta Sergey Brin-ek Stanfordeko Unibertsitatean garatu zuten.
Algoritmoaren funtsezko oinarriak honela dio: zenbat eta lotura gehiago orri bat erreferentziatu are eta web orri baten pisua astunagoa izango da. Eta zenbat eta loturak dituen orriak astunagoa izan, eragina handiagoa izango da. Helburua loturak pisuaren arabera sailkatzea da, horrela zerrenda bat eman ahal izateko bila motor baten emaitza bezala, hau da, lotura garrantzitsuenak aurrean egotea.
PageRank izena Googlek erregistratuta dauka eta prozesua patentatuta dago. Beste bide bat HITS algoritmoa izan daiteke, Jon Kleinbergek sortutakoa.
PageRank algoritmoaren ideiak Soziometrian du jatorria eta jadanik 1953an egiaztatua izan zen. Metodoa 1949an erabili zen lehen aldiz gizakiaren egoera azaltzeko.
d-rekin orri baten pisuaren zati bat (1-d) kendu egingo zaio eta banatua izango da algoritmoak barnean hartzen dituen orri guztien artean. Hau beharrezkoa da pisua inora ez bidaltzen duten orrietara joatea ekiditeko.
PageRank-a 1era normalizatzen bada, orri baten pisua interneteko erabiltzaile batek orri honetan dagoenaren probabilitate bezala interpretatu daiteke. Interneteko erabiltzailea saretik mugitzen da eta d probabilitatearekin oharkabean jadaneko orriaren esteka bat sakatzen du. 1-d probabilitatearekin hautatzen du orri berri bat. Orri batek ez baldin baditu kanporako estekarik, estekak jadanik dauden orri guztietara gehitu daitezke.
Honek bermatzen du PageRank-en balio guztien batura leku guztietatik 1 izatea eta ez balio txikiago bat.
Eragozpenak:
Ez dira esteka guztiak kontutan hartzen adibidez esteken aurrean "Nofollow" baldin badago ez dira kontutan izango PageRank egiterakoan. Hau egiten da spam-a kontrolatzeko asmoarekin eta dauden era ez oso etikoak indizean eragina izatea ekiditeko asmoz.
Honela, ez da komenigarria gure web orrian estekak izatea zeinen PageRank-a 0 den ezta ere esteka abeletxetara hauek esteka sarkorrak eratzeko asmoarekin sortutako lekuak baitira. Gure web orrira estekatzen dituzten beste orriek ezin digute kalte egin, guk estekatzen ditugun web-ak ordez, bai. Hala ere atal honetan aipatzekoa da ere orriaren garrantzia ez du inolako esanahirik daukan informazioa ez baldin badator bat bilatzen denarekin.