La linea verde identifica la funzione di ripartizione di una variabile casuale normale . La linea blu è la funzione di ripartizione empirica calcolata a partire dal campione normale indicato in grigio sull'asse X
In statistica e teoria della probabilità , la funzione di ripartizione empirica (o funzione cumulativa empirica o ECDF ) è una funzione di variabile reale che rappresenta la funzione di ripartizione della misura empirica di un campione .
La funzione di ripartizione empirica è una stima della vera funzione di ripartizione che ha generato il campione e grazie al teorema di Glivenko-Cantelli è possibile affermare che essa converge per
n
→
∞
{\displaystyle n\to \infty }
con probabilità 1 alla distribuzione del campione[1] .
Siano
X
1
,
X
2
,
.
.
.
,
X
n
{\displaystyle X_{1},X_{2},...,X_{n}}
n
{\displaystyle n}
variabili indipendenti e identicamente distribuite con la stessa funzione di ripartizione
F
(
x
)
{\displaystyle F(x)}
. Allora, la funzione di ripartizione empirica può essere scritta come[2] [3] :
F
n
(
x
)
=
1
n
∑
i
=
1
n
I
[
−
∞
,
x
]
(
X
i
)
{\displaystyle F_{n}(x)={1 \over n}\sum _{i=1}^{n}I_{[-\infty ,x]}(X_{i})}
dove
I
[
−
∞
,
x
]
(
X
i
)
{\displaystyle I_{[-\infty ,x]}(X_{i})}
è la funzione indicatrice , uguale a 1 se
X
i
≤
x
{\displaystyle X_{i}\leq x}
e uguale a 0 altrimenti. È possibile equivalentemente scriverla nella sua forma estesa come[4] :
F
n
(
x
)
=
{
0
x
<
X
1
k
n
X
k
<
x
<
X
k
+
1
∀
k
=
1
,
2
,
.
.
.
,
n
−
1
1
x
>
X
n
{\displaystyle F_{n}(x)={\begin{cases}0&x<X_{1}\\{\frac {k}{n}}&X_{k}<x<X_{k+1}\quad \forall k=1,2,...,n-1\\1&x>X_{n}\end{cases}}}
La funzione di ripartizione empirica è uno stimatore corretto e consistente della funzione di ripartizione.
^ (EN ) Azeem M. Shaikh, The Glivenko-Cantelli Theorem (PDF ), su home.uchicago.edu , Università di Chicago.
^ Federico M. Stefanini, Frequenze relative e distribuzioni empiriche , su local.disia.unifi.it , Università di Firenze. URL consultato il 19 febbraio 2018 (archiviato dall'url originale il 18 marzo 2018) .
^ (EN ) van der Vaart, Asymptotic statistics , Cambridge University Press, 1998, p. 265 , ISBN 0-521-78450-6 .
^ Diego Zappa e Silvia Facchinetti, Appunti di statistica , 2013, p. 176, ISBN 9788867800506 .