Phân phối chuẩn nhiều chiều
Hàm mật độ xác suất
|
Hàm phân phối tích lũy
|
Tham số
|
vị trí (véc tơ giá trị thực) ma trận hiệp phương sai (ma trận xác định dương giá trị thực kích thước )
|
Giá
|
|
Hàm mật độ xác suất
|
|
Hàm phân phối tích lũy
|
|
Giá trị kỳ vọng
|
|
Trung vị
|
|
Yếu vị
|
|
Phương sai
|
(ma trận hiệp phương sai)
|
Độ xiên
|
0
|
Độ nhọn
|
0
|
Entropy
|
|
Hàm sinh mô men
|
|
Hàm đặc trưng
|
|
Trong lý thuyết xác suất và thống kê, phân phối chuẩn nhiều chiều, đôi khi được gọi là phân phối Gauss nhiều chiều, là tổng quát hóa của phân phối chuẩn một chiều (còn gọi là phân phối Gauss) cho không gian nhiều chiều hơn. Phân phối này còn có quan hệ gần gũi với phân phối chuẩn ma trận.
Một véc tơ ngẫu nhiên tuân theo một phân phối chuẩn nhiều chiều nếu nó thỏa mãn các điều kiện tương đương nhau sau đây:
- mọi tổ hợp tuyến tính đều tuân theo phân phối chuẩn
- tồn tại một véc tơ ngẫu nhiên , trong đó các thành phần của nó là các biến ngẫu nhiên độc lập tuân theo phân phối chuẩn chuẩn hóa, một véc tơ và một ma trận kích thước sao cho .
- tồn tại một véc tơ và một ma trận đối xứng, nửa xác định dương sao cho hàm đặc trưng của X là
Nếu là ma trận không suy biến, thì phân phối này có thể được mô tả bởi hàm mật độ xác suất sau:
trong đó là định thức của .
Lưu ý rằng phương trình trên suy biến về phương trình của phân phối chuẩn một chiều nếu là một giá trị vô hướng (nghĩa là một ma trận 1x1).
Véc tơ μ trong các điều kiện trên là giá trị kỳ vọng của X và ma trận là ma trận hiệp phương sai của thành phần Xi.
Cần lưu ý rằng ma trận hiệp phương sai có thể suy biến (và khi đó không được mô tả bởi các công thức sử dụng ở trên).
Trường hợp này thường xảy ra trong thống kê; ví dụ, trong phân phối của véc tơ dư trong các bài toán hồi quy tuyến tính thông thường. Cũng lưu ý rằng các Xi nói chung là không độc lập; chúng có thể được xem là kết quả của việc áp dụng biến đổi tuyến tính A cho tập hợp Z gồm các biến ngẫu nhiên Gauss độc lập.
Việc phân phối của một véc tơ ngẫu nhiên X là một phân phối chuẩn nhiều chiều được ký hiệu bởi công thức sau:
hoặc viết tường minh rằng X biến trong không gian N-chiều,
Hàm phân phối tích lũy (cdf) được định nghĩa là xác suất mà mỗi giá trị trong một véc tơ ngẫu nhiên đều nhỏ hơn hay bằng giá trị tương ứng trong véc tơ . Tuy không có dạng đóng cho , có một số thuật toán ước tính giá trị của nó. Ví dụ, xem MVNDST tại
[1] (dùng mã FORTRAN) hay
[2] Lưu trữ 2008-05-13 tại Wayback Machine (dùng mã MATLAB).
Điều kiện rằng hai biến ngẫu nhiên X và Y đều có phân phối chuẩn không kéo theo việc cặp (X, Y) có một phân phối chuẩn có điều kiện phụ thuộc (joint normal distribution). Một ví dụ đơn giản là: Y = X nếu |X| > 1 và Y = −X nếu |X| < 1. Điều này cũng đúng cho số biến ngẫu nhiên nhiều hơn 2.
Nếu X và Y có phân phối chuẩn và độc lập thống kê, thì chúng có một phân phối chuẩn có điều kiện phụ thuộc, nghĩa là cặp (X, Y) phải có phân phối chuẩn 2 chiều. Tuy nhiên, một cặp biến ngẫu nhiên có phân phối chuẩn có điều kiện phụ thuộc không nhất thiết độc lập lẫn nhau.
Trong trường hợp 2 chiều không suy biến, hàm mật độ xác suất (với kì vọng (0,0)) là
trong đó là tương quan giữa và . Khi đó,
- .
Nếu là một biến đổi afin của trong đó là một véc tơ gồm các hằng số và là ma trận , thì có phân phối chuẩn nhiều chiều với giá trị kỳ vọng và phương sai nghĩa là, . Đặc biệt, tập con bất kỳ của đều có một phân phối biên duyên là phân phối chuẩn nhiều chiều.
Để minh họa, ta xét ví dụ sau: để tách tập con , sử dụng
ma trận này trích lấy các phần tử mong muốn.
Một hệ quả khác là phân phối của , trong đó là một véc tơ có cùng số chiều với và dấu chấm ký hiệu phép nhân véc tơ, là phân phối chuẩn một chiều với . Kết quả đó thu được bằng cách sử dụng
và chỉ xét thành phần đầu tiên của tích (hàng đầu của là véc tơ ). Để ý tính chất xác định dương của hàm ý rằng phương sai của tích vô hướng phải là số dương.