En probabilidad y estadística, la familia exponencial es una clase de distribuciones de probabilidad cuya formulación matemática puede expresarse de la manera que se especifica debajo. Esta formulación confiere a las distribuciones de esta familia una serie de propiedades algebraicas y estadísticas muy convenientes.
El concepto de la familia exponencial fue introducido por[1] E. J. G. Pitman,[2] G. Darmois,[3] y B. O. Koopman[4] en 1935.
A continuación se ofrece una serie de definiciones de la familia exponencial con un grado creciente de generalidad y abstracción.
La familia exponencial de parámetro escalar es un conjunto de funciones de distribución cuya función de densidad puede expresarse de la forma
donde , , y son funciones conocidas.
A θ se lo denomina parámetro de la familia.
A menudo, x es un vector de observaciones. En tal caso, T(x) es una función real sobre el espacio de posibles valores de x.
Si η(θ) = θ se dice que la familia exponencial está expresada en su forma canónica. Redefiniendo η = η(θ), es posible expresar una familia exponencial en su forma canónica. De todos modos, la forma canónica no es única dado que η(θ) puede aparecer multiplicado por una constante no nula y T(x), a su vez, multiplicada por su inversa.
La definición anterior puede extenderse al caso de un parámetro vectorial . En tal caso, se dice que una familia de distribuciones pertenece a la familia exponencial cuando su función de densidad puede expresarse de la forma
Como en el caso escalar, se dice que está en forma canónica cuando para todo .
Se dice que la familia exponencial está curvada cuando la dimensión de es menor que la del vector , es decir, cuando la dimensión del vector de parámetros es menor que el número de funciones del vector de parámetros en la representación anterior.
Supóngase que H es una función real de variable real no decreciente y que H(x) tiende a cero cuando x tiende a −∞. Entonces, la integral de Lebesgue–Stieltjes con respecto a dH(x) son integrales con respecto a la medida de referencia de la familia exponencial generada por H.
Un miembro de tal familia exponencial tiene función de distribución
Si F es una función de distribución continua que tiene densidad, se puede escribir dF(x) = f(x) dx.
H(x) es entonces el integrador de Lebesgue–Stieltjes para la medida de referencia. Cuando la medida de referencia es finita puede ser normalizada y H es una función de distribución. Si F es continua y tiene una densidad, lo mismo sucede con H; entonces se puede escribir dH(x) = h(x) dx. Si F es discreta, entonces H es una función escalonada (con escalones en el soporte de F).
En las definiciones anteriores, las funciones , y parecen haber sido definidas arbitrariamente. Sin embargo, desempeñan un papel particular en la función de distribución.
En particular, para el caso escalar y cuando la familia exponencial está expresada en su forma canónica, se tiene que
Derivando con respecto a , se obtiene
e, integrando dicha expresión con respecto a x, (y permutando la integral y la derivada) se llega a que
es decir,
Tomando derivadas sucesivas respecto a puede deducirse que la varianza de T(x) es la derivada segunda de , etc.
Muchas de las familias de funciones de distribución pertenecen a la exponencial. Por ejemplo, la normal, la exponencial, la gamma, la chi-cuadrado, la beta, la Weibull (si el parámetro de forma es conocido), la distribución de Dirichlet, la de Bernoulli, la binomial, la multinomial, la de Poisson, la distribución binomial negativa y la geométrica. También lo es la de Pareto cuando el límite inferior del soporte está fijo.
Sin embargo, las distribuciones uniforme y de Cauchy no forman parte de la familia exponencial. La de Weibull no es de la familia exponencial a no ser que el parámetro de forma sea conocido. Y la de Laplace tampoco lo es a no ser que su media sea conocida e igual a cero.
A continuación se ofrecen algunos ejemplos detallados de la representación de algunas familias de funciones de densidad de acuerdo con el formalismo de las familias exponenciales.
En tal caso, la función de densidad es
Pertenece a la familia exponencial como puede apreciarse identificando
En tal caso, la función de densidad es
y pueden definirse
Como ejemplo de una familia exponencial discreta puede considerarse la binomial. Su función de probabilidad es
que puede escribirse también como
De ahí que esté dentro de la familia exponencial con parámetro natural
De acuerdo con el teorema de Pitman-Koopman-Darmois, dentro de las familias cuyo dominio no varía con el parámetro que se quiere estimar, sólo existe un estadístico suficiente cuya dimensión permanece constante al aumentar el tamaño muestral dentro de las familias exponenciales.
Cuando la función de verosimilitud pertenece a la familia exponencial, siempre existe una distribución de probabilidad a priori conjugada que, además, a menudo, pertenece también a la familia exponencial. Una distribución a priori conjugada π para el parámetro η de la familia exponencial es
donde y son hiperparámetros.
La familia exponencial uniparamétrica es una función monótonamente creciente de su estadístico suficiente T(x) siempre que η(θ) no sea decreciente. Como consecuencia, existe un test uniformemente más potente para verificar la hipótesis H0: θ ≥ θ0 contra H1: θ < θ0.
Aunque el estimador de máxima verosimilitud de una familia de distribuciones no tiene por qué existir o ser único, la situación es distinta dentro de la familia exponencial. De hecho, el logaritmo de la función de verosimilitud es necesariamente cóncavo.