Nghịch lý Simpson (tiếng Anhː Simpson's paradox) hay hiệu ứng Yule–Simpson, là một nghịch lý trong xác suất và thống kê, phát biểu rằng một xu hướng xuất hiện trong nhiều nhóm con của dữ liệu nhưng biến mất hoặc đảo ngược khi các nhóm đó được gộp lại. Nó đôi khi được gọi bằng nghịch lý đảo ngược hay nghịch lý gộp.[1]
Kết quả này thường gặp trong các thống kê của khoa học xã hội và y tế[2] và gây hiểu lầm đặc biệt khi dữ liệu tần suất được diễn giải theo quan hệ nhân quả một cách không phù hợp.[3] Nghịch lý này có thể được giải quyết khi các biến nhiễu và mối quan hệ nhân quả được giải quyết một cách thích hợp trong mô hình thống kê[3][4] (ví dụ: thông qua phân tích cụm (cluster analysis)[5]).
Edward H. Simpson lần đầu tiên mô tả hiện tượng này trong một bài báo kỹ thuật vào năm 1951[6] nhưng các nhà thống kê Karl Pearson (năm 1899)[7]) và Udny Yule (năm 1903)[8] đã đề cập đến những hiệu ứng tương tự trước đó. Cái tên nghịch lý Simpson được Colin R. Blyth giới thiệu vào năm 1972.[9]
Nhà toán học Jordan Ellenberg lập luận rằng nghịch lý Simpson được đặt tên sai vì "không có mâu thuẫn nào liên quan, chỉ có hai cách khác nhau để suy nghĩ về cùng một dữ liệu" và cho rằng bài học của nghịch lý này "không thực sự là cho chúng ta biết nên chọn quan điểm nào mà là nhấn mạnh rằng chúng ta phải ghi nhớ cả các bộ phận và toàn bộ cùng một lúc."[10]
Một bài báo của Pavlides và Perlman (2009) đưa ra bằng chứng rằng trong một bảng ngẫu nhiên 2 × 2 × 2 có phân phối đều, nghịch lý Simpson sẽ xảy ra với xác suất chính xác là 1⁄60.[11] Một nghiên cứu của Kock cho thấy rằng xác suất nghịch lý Simpson sẽ xảy ra ngẫu nhiên trong các mô hình path (tức là các mô hình được tạo ra bởi phân tích path) với hai biến độc lập và một biến phụ thuộc là khoảng 12,8%.[12]
^Rogier A. Kievit, Willem E. Frankenhuis, Lourens J. Waldorp and Denny Borsboom (2013). “Simpson's paradox in psychological science: a practical guide”. Front. Psychol. 4 (513): 1=14. doi:10.3389/fpsyg.2013.00513.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)
^
Simpson, Edward H. (1951). “The Interpretation of Interaction in Contingency Tables”. Journal of the Royal Statistical Society, Series B. 13 (2): 238–241. doi:10.1111/j.2517-6161.1951.tb00088.x.
^
Colin R. Blyth (tháng 6 năm 1972). “On Simpson's Paradox and the Sure-Thing Principle”. Journal of the American Statistical Association. 67 (338): 364–366. doi:10.2307/2284382. JSTOR2284382.
Leila Schneps và Coralie Colmez, Math on trial. How numbers get used and abused in the courtroom, Basic Books, 2013. ISBN 978-0-465-03292-1. (Sixth chapter: "Math error number 6: Simpson's paradox. The Berkeley sex bias case: discrimination detection").
The Wall Street Journal column "The Numbers Guy" for ngày 2 tháng 12 năm 2009 dealt with recent instances of Simpson's paradox in the news. Notably a Simpson's paradox in the comparison of unemployment rates of the 2009 recession with the 1983 recession, by Cari Tuna (substituting for regular columnist Carl Bialik).
Ông chính là người đã để lại một báu vật tại hòn đảo cuối cùng của Grand Line, sau này báu vật ấy được gọi là One Piece, và hòn đảo đó được Roger đặt tên Laugh Tale
Trái ngược với Tử quỷ tộc [Goblin] (Quỷ nhỏ), đây là chủng tộc mạnh mẽ nhất trong Đại sâm lâm Jura (tính đến thời điểm trước khi tên trai tân nào đó bị chuyển sinh đến đây).