In statistica bayesiana, un intervallo di credibilità (o intervallo di confidenza bayesiano) è un intervallo nel dominio di una distribuzione di probabilità a posteriori impiegata per la stima di intervalli.[1] La generalizzazione a problemi multivariati è la regione di credibilità. Gli intervalli di credibilità sono analoghi agli intervalli di confidenza in statistica frequentista.[2]
Per esempio, in un esperimento che determina la distribuzione di incertezza di un parametro , se la probabilità che stia tra 35 e 45 è 0.95, allora è un intervallo di credibilità al 95%.
Gli intervalli di credibilità non sono univocamente associati ad una distribuzione a posteriori. Esistono vari metodi per definire un adeguato intervallo di credibilità, tra i quali:
È possibile inquadrare la scelta di un intervallo di credibilità nell'ambito della teoria delle decisioni e, in quel contesto, un intervallo ottimale sarà sempre un insieme di densità di probabilità più elevata.[3]
Nell'approccio frequentista un intervallo di confidenza al 95% di 35–45 significa che, ripetendo il campionamento dei dati per un numero elevato di volte, il 95% degli intervalli di confidenza calcolati includerebbe il valore vero del parametro in esame. La probabilità che il parametro sia all'interno di un dato intervallo (diciamo 35–45) è 1 oppure 0 (il parametro non casuale è all'interno dell'intervallo oppure no). In termini frequenzistici, il parametro è fissato (non può essere considerato possedere una distribuzione di possibili valori) e l'intervallo di confidenza è casuale (in quanto dipende dal campione di dati raccolto). Antelman (1997, p. 375) riassume un intervallo di confidenza come "... un intervallo generato da una procedura che darà intervalli corretti il 95% delle volte".[4]
In generale, gli intervalli di credibilità bayesiani non coincidono con gli intervalli di confidenza in statistica frequentista per due ragioni:
Nel caso di un singolo parametro e di dati che possono essere riassunti in una singola statistica sufficiente, può essere dimostrato che l'intervallo di credibilità e quello di confidenza coincidono se il parametro incognito è un parametro di posizione (ad esempio la media) (cioè la funzione di probabilità "in avanti" ha la forma ), avente una distribuzione a priori uniforme;[5] e anche se il parametro incognito è un parametro di scala (cioè la funzione di probabilità "in avanti" ha la forma ), con una distribuzione di probabilità a priori di Jeffreys [5]. L'ultima sussiste in quanto prendendo il logaritmo di un parametro di scala lo converte in un parametro di posizione dotato di distribuzione uniforme. Tuttavia questi sono casi, seppure importanti, chiaramente particolari; in generale nessuna equivalenza generale può essere supposta.