Kiểm định giả thuyết thống kê

Kiểm định giả thuyết thống kê (statistical hypothesis test) là phương pháp ra quyết định sử dụng dữ liệu, hoặc từ thí nghiệm hoặc từ nghiên cứu quan sát (observational study)(không có kiểm soát). Trong thống kê (statistics), một kết quả được gọi là đủ độ tin cậy mang tính thống kê (statistically significant) nếu nó ít có khả năng diễn ra theo một ngưỡng xác suất cho trước (ví dụ 5% hay 10%). Cụm từ kiểm định độ tin cậy ("test of significance") được đưa ra bởi Ronald Fisher.

Kiểm định giả thuyết đôi khi được gọi là phân tích dữ liệu để khẳng định, để so sánh với phân tích dữ liệu để khám phá.

Ví dụ 1 – Kết luận xử án

[sửa | sửa mã nguồn]

Một đợt kiểm định độ tin cậy được tiến hành cho một tội phạm. Bị cáo sẽ chưa bị kết luận là có tội khi tội của anh ta chưa được chứng minh. Nguyên đơn cố gắng chứng minh tội của bị cáo. Chi khi có đủ bằng chứng thì bị cáo mới bị buộc tội.

Bắt đầu đợt kiểm định, có hai giả thuyết : "bị cáo không có tội", và : "bị cáo có tội". Giả thuyết thứ nhất được gọi là Giả thuyết không (null hypothesis), và hiện tại đang được chấp nhận. Giả thuyết thứ 2 được gọi là giả thuyết nghịch (alternative hypothesis). Đây là giả thuyết mà nguyên đơn cố gắng chứng minh.

Giả thuyết 1 chỉ được bác bỏ nếu lỗi nói sai rất ít khả năng xảy ra, bởi vì chúng ta không muốn đổ oan cho người vô tội. Lỗi nói sai đó được gọi là lỗi loại một (nghĩa là đổ oan cho người vô tội), và khả năng mắc lỗi này được kiểm soát sao cho ít xảy ra nhất. Vì do chúng ta cố gắng không áp tội cho người khác, nên xảy ra lỗi loại 2 (bỏ thoát tội một người mà thực tế có tội), xác suất lỗi này thường lớn hơn.

Null Hypothesis (H0) là đúng
Anh ta thực sự không có tội
Alternative Hypothesis (H1) là đúng
Anh ta thực sự có tội
Chấp nhận Null Hypothesis
Xóa án
Quyết định đúng Quyết định sai
Lỗi loại II
Bác bỏ Null Hypothesis
Kết án
Quyết định sai
Lỗi loại I
Quyết định đúng

Phiên tòa có thể được coi là một hay cả hai quá trình: có tội với không có tội hoặc bằng chứng với một người ("quá một mức nghi ngờ hợp lý"). Kiểm định giả thuyết ở đây là hoặc kiểm định giả thuyết hoặc kiểm định bằng chứng.

  • Lehmann, E.L.(1970). Testing statistical hypothesis (5th ed.). Ney York: Wiley.
  • Lehmann E.L. (1992) "Introduction to Neyman and Pearson (1933) On the Problem of the Most Efficient Tests of Statistical Hypotheses". In: Breakthroughs in Statistics, Volume 1, (Eds Kotz, S., Johnson, N.L.), Springer-Verlag. ISBN 0-387-94037-5 (followed by reprinting of the paper)
  • Neyman, J.; Pearson, E.S. (1933). “On the Problem of the Most Efficient Tests of Statistical Hypotheses”. Phil. Trans. R. Soc., Series A. 231: 289–337. doi:10.1098/rsta.1933.0009.

Tham khảo

[sửa | sửa mã nguồn]

Liên kết ngoài

[sửa | sửa mã nguồn]
Chúng tôi bán
Bài viết liên quan
Làm thế nào để biết bạn có bị trầm cảm hay không?
Làm thế nào để biết bạn có bị trầm cảm hay không?
Lo lắng và trầm cảm có một số biểu hiện tương đối giống nhau. Nhưng các triệu chứng chủ yếu là khác nhau
[Review] Wonder Woman 1984: Nữ quyền, Sắc tộc và Con người
[Review] Wonder Woman 1984: Nữ quyền, Sắc tộc và Con người
Bối cảnh diễn ra vào năm 1984 thời điểm bùng nổ của truyền thông, của những bản nhạc disco bắt tai và môn thể dục nhịp điệu cùng phòng gym luôn đầy ắp những nam thanh nữ tú
Một tip nhỏ về Q của Bennett và snapshot
Một tip nhỏ về Q của Bennett và snapshot
Nhắc lại nếu có một vài bạn chưa biết, khái niệm "snapshot" dùng để chỉ một tính chất đặc biệt của kĩ năng trong game
Kishou Arima: White Reaper trong Tokyo Ghoul
Kishou Arima: White Reaper trong Tokyo Ghoul
Kishou Arima (有馬 貴将, Arima Kishō) là một Điều tra viên Ngạ quỷ Cấp đặc biệt nổi tiếng với biệt danh Thần chết của CCG (CCGの死神, Shīshījī no Shinigami)