En teoria i estadística de probabilitats, la funció probit és la funció quantil associada a la distribució normal estàndard. Té aplicacions en anàlisi de dades i aprenentatge automàtic, en particular gràfics estadístics exploratoris i modelització de regressió especialitzada de variables de resposta binària.[1]
Matemàticament, el probit és la inversa de la funció de distribució acumulada de la distribució normal estàndard, que es denota com , de manera que el probit es defineix com [2]
.
En gran part a causa del teorema central del límit, la distribució normal estàndard té un paper fonamental en la teoria de la probabilitat i l'estadística. Si tenim en compte el fet conegut que la distribució normal estàndard situa el 95% de la probabilitat entre −1,96 i 1,96, i és simètrica al voltant de zero, es dedueix que
La funció probit proporciona el càlcul "invers", generant un valor d'una variable aleatòria normal estàndard, associada a una probabilitat acumulada especificada. Continuant amb l'exemple,[3]
.
En general,
i
La idea de la funció probit va ser publicada per Chester Ittner Bliss en un article de 1934 a Science sobre com tractar dades com el percentatge d'una plaga morta per un plaguicida.[4] Bliss va proposar transformar el percentatge de morts en un " probability unit " (o "probit") que estava relacionat linealment amb la definició moderna (el va definir arbitràriament igual a 0 per a 0,0001 i 1 per a 0,9999)[5]
La distribució normal CDF i la seva inversa no estan disponibles en forma tancada, i el càlcul requereix un ús acurat de procediments numèrics. No obstant això, les funcions estan àmpliament disponibles en programari per a estadístiques i modelització de probabilitats, i en fulls de càlcul. A Microsoft Excel, per exemple, la funció probit està disponible com a norm.s.inv(p). En entorns informàtics on hi ha disponibles implementacions numèriques de la funció d'error invers, la funció probit es pot obtenir com