Ovaj članak ili neki od njegovih odlomaka nije dovoljno potkrijepljen izvorima (literatura, veb-sajtovi ili drugi izvori). |
Ovom članku potrebna je jezička standardizacija, preuređivanje ili reorganizacija. |
George Kingsley Zipf je bio je američki lingvist i filolog koji je studirao statističke pojave na različitim jezicima. Zipf je bio predsjednik njemačkog odjela i univerzitetski profesor na Univerzitetu Harvard. Radio je sa kineskim jezikom i demografijom, i većina njegovog rada se odnosi na značajke interneta, distribucije prihoda i mnogim drugim bazama podataka.
G.K. Zipf je istraživao distribuciju riječi u tekstu, i ustanovio je sličnu pojavu kakva je uočena u Bradfordovom i Lotkinovom zakonu: mali broj riječi pojavljuje se vrlo često. Ako se riječi poredaju po frekvenciji pojavljivanja onda je umnožak redoslijeda pojavljivanja sa frekvencijom pojavljivanja konstantan
Fr = c
Zipfov zakon odnosi se na učestalost distribucije. Grafički se distribucija riječi prema Zipfovom zakonu može prikazati kao hiperbolička kriva. Zipfov model distribucije riječi u osnovi je jednak modelu Bradfordovog zakona, samo je primijenjen u drugom području. Zipfov zakon našao je primjenu u planiranju jezika za indeksiranje administrativnih poslova biblioteka.
Jednostavan opis podataka koji slijedi iz Zipfove distribucije je da oni imaju nekoliko elemenata kojima je rezultat vrlo visok, te velik broj elemenata kojima je rezultat vrlo nizak. Zipfova distribucije karakteriziraju upotrebu riječi u prirodnome jeziku i popularnost knjižnice, tako da naprimjer jezik ima nekoliko riječi ( i , naprimjer) koje se često koriste, a biblioteka ima nekoliko knjiga koje svako želi posuditi. Podaci pokazuju da mnoge web stranice koriste slijed Zipfove distribucije.
Matematički gledano, nije moguće izvorni oblik Zipfovog zakona u jeziku sa beskonačnim riječima smatrati u potpunosti tačnim. U ovom slučaju svaka pozitivna konstanta C smatra se zbirom negativne frekvencije koja se može izraziti geometrijskim nizom.