William Sealy Gosset

William Gosset vuonna 1908, jolloin hän julkaisi artikkelin keksimästään t-testistä.

William Sealy Gosset (13. kesäkuuta 187616. lokakuuta 1937) oli englantilainen tilastotieteilijä, kemisti ja Guinnessin panimon johtava panimomestari. Hän kuuluu modernin tilastotieteen pioneereihin keksittyään Studentin t-testin, joka soveltuu pienten aineistojen tilastolliseen testaukseen. Testi on edelleen kaikkein suosituin tilastollinen testi maailmassa sen laajan käyttökelpoisuuden takia. [1]

Gosset opiskeli kemiaa ja matematiikkaa Oxfordissa, mistä hänet palkattiin vuonna 1899 valmistumisensa jälkeen Guinessin panimomestariksi. Hän toimi yhtiön palveluksessa lopun ikänsä 38 vuoden ajan. Rekrytointi osoitti Britannian elintarviketeollisuuden kehitysvaihetta, jossa tieteen avulla haluttiin kehittää tuotteista yhä parempia.[1]

t-testin kehittäminen

[muokkaa | muokkaa wikitekstiä]
t-testin kehittäminen liittyi Guinness-oluen laadun parantamiseen.

Gosset lähti etsimään sopivinta ohralaatua oluen panoon. Tarjolla oli useita lajikkeita, kuten Old Irish ja Archer. Ongelmana oli se, että panimolla oli koetiloja vain pari- kolmekymmentä. Pienen otoksen takia otantajakautuma ei ollut normaali, joten Gosset ei voinut testata normaalijakautuman avulla olivatko laatujen erot todellisia vai satunnaisia.[1] Gosset kirjoitti vuonna 1905: ”Kun vähennämme kokeiden määrää, otoksesta lasketun keskihajonnan arvo vääristyy, kunnes tämän avulla tehdyt päätelmät muuttuvat täysin harhaanjohtaviksi". Gosset oli siis havainnut, että vaikka itse ilmiö noudattaisi normaalijakautumaa, sen otantajakautuma ei ole muodoltaan normaali, jos otoskoko on pieni. Otantajakautuma on todellisuudessa sitä litteämpi mitä vähemmän tapauksia otoksessa on. [1]

t-jakauman löytäminen

[muokkaa | muokkaa wikitekstiä]

Ollessaan kesälomalla vuonna 1905 Gosset pyöräili muutaman kymmenen kilometrin päässä asuneen Karl Pearsonin luo hakemaan neuvoa. Keskustelun jälkeen Gosset alkoi tehdä laskelmia, joiden avulla hän löysi tiheysfunktion, jota pienet aineistot noudattavat. Tämä jakautuma, joka sai nimekseen t-jakautuma, oli voimakkaasti riippuvainen vapausasteista, joita yhden otoksen testissä on n-1, missä n on otoksen koko. [1]

Gosset pystyi nyt analysoimaan koetilojen tulokset ja havaitsi, että paras ohralajike oli Archer. Vuonna 1907 Guinness osti kaiken saatavilla olleen Archerin (1000 tynnyriä) ja jakoi sen sopimusviljelijöilleen. Seuraavana vuonna jaettiin jo 10 000 tynnyriä. Sotien välisenä aikana 90 % kaikesta Pohjois-Irlannissa viljellystä oli Archeria.[1]

Keksijän salaaminen

[muokkaa | muokkaa wikitekstiä]

Vuonna 1908 Gosset julkaisi löytönsä brittiläisessä Biometrika -lehdessä, jonka yksi toimittaja oli Karl Pearson. Julkaisu tapahtui nimimerkillä "Student" eli opiskelija, mistä tulee myös testille vakiintunut nimi "Studentin t-testi. [2] Syynä nimimerkin käyttöön oli se, että panimo piti Gosset:n keksimää testiä Guinessin yrityssalaisuutena ja kielsi panimomestariaan levittämästä tietoa.[1]

Myöhemmät vaiheet

[muokkaa | muokkaa wikitekstiä]

Tulevina vuosina Gosset kirjoitti samaan lehteen lisää merkittäviä artikkeleita. Anekdootin mukaan yhtiö pääsi asiasta selville vasta, kun Gosset kuoli ja hänen tutkijaystävänsä ottivat yhteyttä panimoon saadakseen siltä rahallista tukea Gosset:n koottujen teosten julkaisemiseen. Amerikkalainen tilastotieteilijä Harold Hotelling on kertonut, että hänen tapaamisensa Gosset:n kanssa vielä 1930-luvulla tapahtui vakoilutarinoista tuttujen salaisten järjestelyjen merkeissä. Gosset:n kerrotaan suhtautuneen vaatimattomasti t-testiinsä. Hänen kerrotaan sanoneen, että Fisher olisi sen kuitenkin pian keksinyt.[1]

  1. a b c d e f g h Salsburg, David: The Lady Tasting Tea. How Statistics Revolutionalized Science in the Twentieth Century, s. 25–33. A.W.H. Freeman, 2002.
  2. Student: The Probable error of the Mean. Biometrika, VII, 1–25, 1908. Artikkelin verkkoversio.