Bài dịch từ "Does probability exist?", David Spiegelhalter, Nature 636, 560-563 (2024)
Trong cuộc sống hằng ngày, sự không chắc chắn thường được diễn đạt bằng lời nói, trong Anh ngữ có các từ như “could”, “might” hoặc “is likely to”. Nhưng những từ ngữ diễn tả sự không chắc chắn có thể bị hiểu sai và dẫn đến những hệ quả nghiêm trọng. Năm 1961, tổng thống Hoa Kì mới đắc cử John F.Kennedy được thông báo về một kế hoạch do CIA tài trợ nhằm tấn công Cuba. Ông yêu cầu các quan chức quân đội cấp cao đưa ra đánh giá. Họ đã kết luận rằng nhiệm vụ có 30% khả năng thành công – tức là, có 70% thất bại. Tuy nhiên, trong báo cáo gửi đến tổng thống, điều này được diễn giải thành “một cơ hội công bằng” (a fair chance). Sự kiện xâm lược Vịnh Con Lợn đã diễn ra và trở thành một thảm họa. Hiện nay đã có các thang đo được thiết lập để chuyển đổi các từ ngữ không chắc chắn thành các con số gần đúng. Ví dụ, bất kỳ ai trong cộng đồng tình báo Anh sử dụng thuật ngữ “likely” đều nên hiểu rằng khả năng xảy ra nằm trong khoảng từ 55% - 75%.
Tuy nhiên, bất kì con số xác suất nào dù trong một bài báo khoa học, đều không phải là một thuộc tính khách quan (objective property) của thế giới, mà là một cấu trúc (construction) dựa trên các phán đoán (judgement) cá nhân hoặc tập thể cùng với các giả định (assumption). Hơn nữa, trong hầu hết các trường hợp, xác suất không ước tính một con số thật (true). Xác suất hiếm khi được cho là thật sự tồn tại.
Để hiểu được bản chất khó nắm bắt của khái niệm xác suất, hãy xem xét cách khái niệm này được sử dụng trong dự báo thời tiết ngày nay. Các nhà khí tượng học đưa ra dự đoán về nhiệt độ, tốc độ gió, lượng mưa, và thường là với con số phần trăm xác suất chẳng hạn như 70% cho một thời điểm và địa điểm nhất định. Nhiệt độ, tốc độ gió, lượng mưa có thể được so sánh với các giá trị thực của chúng; vì có thể đo lường giá trị thực vào một thời điểm trong tương lai để so sánh với giá trị dự báo. Thế nhưng, không tồn tại một giá trị xác suất thực để so sánh với đánh giá của người dự báo. Không có cái gọi là đồng hồ đo xác suất (probability-ometer). Hoặc là mưa, hoặc là không mưa.
Hơn nữa, như triết gia Ian Hacking nhấn mạnh, xác suất bao gồm cả sự ngẫu nhiên (chance) và sự thiếu hiểu biết (ignorance). Hãy tưởng tượng tôi tung một đồng xu và hỏi bạn về xác suất xuất hiện mặt ngửa, bạn vui vẻ trả lời “50-50”. Bây giờ, tôi tung đồng xu, liếc nhìn kết quả, vậy xác suất xuất hiện mặt ngửa của bạn là bao nhiêu? Lưu ý rằng, tôi nói xác suất của bạn, không phải xác suất. Hầu hết mọi người tỏ ra ngần ngại với câu trả lời "50-50" của mình. Nhưng sự kiện đã xảy ra, tôi đã nhìn thấy kết quả và không còn sự ngẫu nhiên nào nữa - chỉ còn sự thiếu hiểu biết của bạn. Tính huống đã chuyển từ “sự không chắc chắn ngẫu nhiên” (‘aleatory’ uncertainty) về tương lai mà chúng ta không thể biết sang “sự không chắc chắn nhận thức” (‘epistemic’ uncertainty) về hiện tại mà chúng ta không được biết. Xác suất được sử dụng cho cả 2 tình huống này.
Còn có một bài học khác ở đây. Ngay cả khi có một mô hình thống kê về những gì nên xảy ra, thì điều này luôn dựa trên các giả định chủ quan (subjective assumption) – trong trường hợp tung đồng xu, rằng có hai kết quả có khả năng xảy ra ngang nhau. Điều này có thể bị khẳng định một cách vội vàng, hấp tấp.
Một số giả định được sử dụng để đánh giá xác suất sẽ có lý lẽ biện minh mạnh mẽ hơn những giả định khác. Nếu tôi đã xem xét kỹ lưỡng một đồng xu trước khi tung nó lên, nó rơi xuống một bề mặt cứng và nảy lên một cách hỗn loạn, tôi sẽ cảm thấy phán đoán 50-50 của mình là hợp lý hơn so với việc để một nhân vật mờ ám nào đó sử dụng một đồng xu được chuẩn bị từ trước. Những hạn chế tương tự này áp dụng ở bất kỳ nơi nào sử dụng xác suất – bao gồm cả trong bối cảnh khoa học.
Đây là một ví dụ về tầm quan trọng thực sự của khoa học. Ngay sau khi đại dịch COVID-19 bắt đầu, các thử nghiệm phục hồi (RECOVERY trial) đã bắt đầu thử nghiệm các liệu pháp trên những người nhập viện vì COVID-19 tại Vương quốc Anh. Trong một thí nghiệm, hơn 6.000 người được phân phối ngẫu nhiên vào 2 nhóm; nhóm 1 nhận được sự chăm sóc tiêu chuẩn được cung cấp tại bệnh viện nơi họ đang được điều trị; nhóm 2 nhận được sự chăm sóc như nhóm 1 và cộng thêm một liều dexamethasone, một loại steroid giá rẻ. Nguy cơ tử vong hàng ngày đã điều chỉnh theo độ tuổi thấp hơn 29% trong nhóm được phân bổ dexamethasone so với nhóm chỉ được chăm sóc tiêu chuẩn (khoảng tin cậy 95% là 19–49%). P-value, nghĩa là xác suất được tính toán để quan sát một rủi ro tương đối cực đoan như vậy khi chấp nhận giả thuyết vô hiệu (null hypothesis) – tức là giả thuyết không có sự khác biệt giữa 2 nhóm, được tính toán là 0.01%.
Đây là tất cả các phân tích chuẩn. Nhưng độ tin cậy và P-value phụ thuộc vào nhiều thứ hơn việc giả định giả thuyết vô hiệu là đúng. Nó cũng phụ thuộc vào tất cả các giả định trong mô hình thống kê, chẳng hạn như các quan sát là độc lập: rằng không có yếu tố nào khiến những người được điều trị trong những không gian và thời gian tương đồng có kết quả giống nhau hơn. Nhưng có nhiều yếu tố như vậy, cho dù đó là bệnh viện nơi mọi người đang được điều trị hay chế độ chăm sóc thay đổi. Giá trị chính xác cũng phụ thuộc vào tất cả những người tham gia trong mỗi nhóm có cùng xác suất sống sót cơ bản sau 28 ngày. Điều này sẽ khác nhau vì đủ mọi lý do.
Những giả định vội vàng đó không nhất thiết dẫn đến một kết quả phân tích sai. Trong trường hợp này, tín hiệu (signal) quá mạnh đến mức một mô hình cho phép, chẳng hạn, rủi ro cơ bản thay đổi giữa những người tham gia sẽ không tạo ra nhiều khác biệt đối với kết luận chung. Tuy nhiên, nếu kết quả có biên độ lớn hơn (more marginal), thì việc phân tích mở rộng về độ nhạy (sensitivity) của mô hình đối với các giả định thay thế là phù hợp.
"Tất cả các mô hình đều sai, nhưng một số thì hữu ích" (George Box). Phân tích dexamethasone đặc biệt hữu ích vì kết luận chắc chắn của nó đã thay đổi hoạt động lâm sàng và cứu sống hàng trăm nghìn người. Nhưng các xác suất mà kết luận dựa trên không “thật” (true) - chúng là sản phẩm của các giả định và phán đoán chủ quan nhưng hợp lý.
Xin lưu ý rằng tôi không nói về thế giới lượng tử. Ở cấp độ dưới nguyên tử, toán học chỉ ra rằng các sự kiện không có nguyên nhân có thể xảy ra với xác suất cố định (mặc dù ít nhất một cách giải thích nêu rằng ngay cả những xác suất đó cũng thể hiện mối quan hệ với các vật thể hoặc người quan sát khác, thay vì là các đặc tính nội tại của các vật thể lượng tử). Nhưng có vẻ như điều này có ảnh hưởng không đáng kể đến các sự kiện được quan sát hàng ngày trong thế giới vĩ mô.
Tôi cũng tránh những lập luận hàng thế kỷ về việc liệu thế giới, ở cấp độ phi lượng tử, có phải là tất định hay không và liệu chúng ta có ý chí tự do để tác động đến diễn biến của các sự kiện. Bất kể câu trả lời là gì, chúng ta vẫn cần phải xác định xác suất khách quan thực sự là gì.
Nhiều nỗ lực đã được thực hiện để làm điều này trong nhiều năm, nhưng đều có những hạn chế. Những nỗ lực này bao gồm xác suất tần suất (frequentist probability), một phương pháp xác định tỷ lệ các sự kiện sẽ được nhìn thấy trong vô số lần lặp lại của các tình huống giống hệt nhau – ví dụ, lặp lại cùng một thử nghiệm lâm sàng trong cùng một quần thể với cùng các điều kiện nhiều lần. Điều này có vẻ khá phi thực tế. Nhà thống kê Ronald Fisher đã đề xuất việc nghĩ về một tập dữ liệu duy nhất như một mẫu từ một quần thể giả định vô hạn (hypothetical infinite population), nhưng điều này có vẻ giống một thí nghiệm tư duy hơn là một thực tế khách quan. Hoặc có ý tưởng mang tính bán huyền bí rằng tồn tại một khuynh hướng thực sự tiềm ẩn đối với một sự kiện cụ thể xảy ra trong một bối cảnh nhất định, chẳng hạn như tôi sẽ bị đau tim trong vòng mười năm tới. Điều này có vẻ như không thể xác minh được.
Có một phạm vi hạn chế các tình huống được kiểm soát tốt, có thể lặp lại với độ phức tạp vô cùng lớn đến mức, ngay cả khi chúng về cơ bản là xác định, vẫn phù hợp với mô hình tần suất (frequentist paradigm) bằng cách có phân phối xác suất với các thuộc tính có thể dự đoán được trong thời gian dài. Chúng bao gồm các thiết bị ngẫu nhiên hóa tiêu chuẩn (standard randomizing devices), chẳng hạn như vòng quay roulette, xào bài, tung đồng xu, ném xúc xắc và quả bóng xổ số, cũng như các máy tạo số giả ngẫu nhiên (seudo-random number generators), dựa trên các thuật toán hỗn loạn, phi tuyến tính để đưa ra các con số vượt qua các bài kiểm tra về tính ngẫu nhiên.
Trong thế giới tự nhiên, chúng ta có chuyển động của tập hợp các phân tử khí, ngay cả khi tuân theo vật lý Newton, vẫn phù hợp với các quy luật thống kê; và di truyền học, trong đó sự phức tạp của quá trình chọn lọc và tái tổ hợp nhiễm sắc thể tạo ra tỷ lệ di truyền ổn định. Trong những trường hợp hạn chế này, có thể hợp lý khi giả định một xác suất giả khách quan (a pseudo-objective probability), thay vì một xác suất chủ quan (subjective probability).
Tuy nhiên, trong mọi tình huống khác mà xác suất được sử dụng – từ các lĩnh vực rộng lớn của khoa học đến thể thao, kinh tế, thời tiết, khí hậu, phân tích rủi ro, mô hình thảm họa,... – thì việc coi phán đoán của chúng ta là ước tính về xác suất “thực” là không hợp lý. Đây chỉ là những tình huống chúng ta cố gắng biểu đạt sự không chắc chắn dưới dạng xác suất, dựa trên kiến thức và phán đoán của bản thân.
Một trong những nỗ lực đầu tiên được thực hiện vào năm 1926 bởi nhà toán học Frank Ramsey tại Đại học Cambridge, Vương quốc Anh. Ramsey đã chứng minh rằng tất cả các quy luật xác suất (laws of probability) có thể được bắt nguồn từ sở thích đối với những trò cá cược. Các kết quả được gán giá trị lợi ích (utility), và việc đánh cược được tóm lại bởi giá trị lợi ích kỳ vọng (expected utility), vốn được xác định bởi các con số mang tính chủ quan biểu thị phần nào niềm tin – tức là các xác suất cá nhân của chúng ta. Tuy nhiên, cách diễn giải này đòi hỏi phải chỉ định các giá trị lợi ích cụ thể. Gần đây hơn, người ta đã chứng minh rằng các quy luật xác suất có thể được suy ra đơn giản bằng cách hành động nhằm tối đa hóa hiệu suất kỳ vọng khi sử dụng một quy tắc chấm điểm phù hợp, chẳng hạn như quy tắc được trình bày trong hộp văn bản “Tôi mù mờ đến mức nào?” (How ignorant am I?) bên dưới đây:
Những nỗ lực định nghĩa xác suất thường khá mơ hồ. Ví dụ, trong bài báo năm 1941-2 “The Applications of Probability to Cryptography”, Alan Turing sử dụng định nghĩa “Xác suất của một sự kiện trên một số bằng chứng nhất định là tỷ lệ các trường hợp mà sự kiện đó có thể được mong đợi xảy ra dựa trên bằng chứng đó”. Điều này thừa nhận rằng xác suất thực tế dựa trên kỳ vọng – phán đoán của con người. Nhưng khi nói đến “các trường hợp”, Turing hàm ý rằng các trường hợp của cùng quan sát hay của cùng phán đoán?
Cái sau có điểm chung với định nghĩa của chủ nghĩa tần suất về xác suất khách quan, chỉ khác là lớp các quan sát tương tự lặp lại được thay thế bằng lớp các phán đoán chủ quan tương tự lặp lại. Theo quan điểm này, nếu khả năng mưa được đánh giá là 70%, điều này đặt nó vào tập hợp các dịp mà người dự báo gán xác suất 70%. Bản thân sự kiện này được kỳ vọng sẽ xảy ra trong 70% các dịp như vậy. Đây có lẽ là định nghĩa yêu thích của tôi. Nhưng sự mơ hồ của xác suất được chứng minh rõ ràng bởi thực tế là, sau gần bốn thế kỷ, có rất nhiều người sẽ không đồng ý với tôi về điều đó.
Tuy nhiên, trên thực tế, có lẽ chúng ta không cần phải quyết định xem liệu xác suất khách quan có thực sự tồn tại trong thế giới phi lượng tử không. Thay vào đó, chúng ta có thể áp dụng cách tiếp cận thực dụng. De Finetti đã đưa ra lập luận thuyết phục nhất cho cách tiếp cận này trong tác phẩm năm 1931 của ông về "Khả năng trao đổi" (exchangeability), dẫn đến một định lý nổi tiếng mang tên ông. Một chuỗi sự kiện được coi là có thể trao đổi (exchangeable) nếu xác suất chủ quan của chúng ta đối với mỗi chuỗi không bị ảnh hưởng bởi thứ tự quan sát của chúng ta. De Finetti đã chứng minh một cách xuất sắc rằng giả định này về mặt toán học tương đương với việc hành động như thể các sự kiện là độc lập, mỗi sự kiện có một xác suất xảy ra và rằng sự không chắc chắn của chúng ta về xác suất chưa biết đó được thể hiện bằng một phân phối xác suất nhận thức chủ quan (a subjective, epistemic probability distribution). Điều này thật đáng chú ý: nó cho thấy rằng, bắt đầu từ một biểu hiện cụ thể nhưng hoàn toàn chủ quan của niềm tin, chúng ta nên hành động như thể các sự kiện được thúc đẩy bởi xác suất khách quan.
Thật phi thường khi một khối lượng công trình quan trọng, làm nền tảng cho toàn bộ khoa học thống kê và nhiều hoạt động khoa học và kinh tế khác, lại nảy sinh từ một ý tưởng khó nắm bắt như vậy. Và vì vậy tôi sẽ kết luận bằng câu cách ngôn của riêng mình:
Xác suất có lẽ không tồn tại - nhưng thường hữu ích khi hành động như thể nó tồn tại.
Probability probably does not exist - but it is often useful to act as if it does.
Illustration: Sébastien Thibault
Cuộc đời đầy những bất định. Không ai biết trước điều gì sẽ xảy ra. Con người biết rất ít về quá khứ và cả hiện tại bên ngoài trải nghiệm trực tiếp của bản thân. Sự không chắc chắn có thể về thời tiết ngày mai, nhà vô địch Premier League mùa giải kế tiếp, khí hậu năm 2100 hoặc danh tính của tổ tiên xa xưa. Trong cuộc sống hằng ngày, sự không chắc chắn thường được diễn đạt bằng lời nói, trong Anh ngữ có các từ như “could”, “might” hoặc “is likely to”. Nhưng những từ ngữ diễn tả sự không chắc chắn có thể bị hiểu sai và dẫn đến những hệ quả nghiêm trọng. Năm 1961, tổng thống Hoa Kì mới đắc cử John F.Kennedy được thông báo về một kế hoạch do CIA tài trợ nhằm tấn công Cuba. Ông yêu cầu các quan chức quân đội cấp cao đưa ra đánh giá. Họ đã kết luận rằng nhiệm vụ có 30% khả năng thành công – tức là, có 70% thất bại. Tuy nhiên, trong báo cáo gửi đến tổng thống, điều này được diễn giải thành “một cơ hội công bằng” (a fair chance). Sự kiện xâm lược Vịnh Con Lợn đã diễn ra và trở thành một thảm họa. Hiện nay đã có các thang đo được thiết lập để chuyển đổi các từ ngữ không chắc chắn thành các con số gần đúng. Ví dụ, bất kỳ ai trong cộng đồng tình báo Anh sử dụng thuật ngữ “likely” đều nên hiểu rằng khả năng xảy ra nằm trong khoảng từ 55% - 75%.
Nguồn: https://www.gov.uk/government/news/defence-intelligence-communicating-probability
Những nỗ lực diễn đạt sự may rủi và sự không chắc chắn thành những con số dẫn đến toán học xác suất, mà ngày nay được sử dụng trong hầu hết các lĩnh vực nghiên cứu. Ví dụ, bất kì tạp chí khoa học nào cũng dễ dàng tìm thấy các giá trị P (P-value), khoảng tin cậy (confidence interval) và phân phối hậu nghiệm Bayes (Bayesian posterior distributions), tất cả đều phụ thuộc vào xác suất.Tuy nhiên, bất kì con số xác suất nào dù trong một bài báo khoa học, đều không phải là một thuộc tính khách quan (objective property) của thế giới, mà là một cấu trúc (construction) dựa trên các phán đoán (judgement) cá nhân hoặc tập thể cùng với các giả định (assumption). Hơn nữa, trong hầu hết các trường hợp, xác suất không ước tính một con số thật (true). Xác suất hiếm khi được cho là thật sự tồn tại.
1. Xác suất – kẻ đến sau
Xác suất đến sau toán học. Mãi đến khi các nhà toán học người Pháp Blaise Pascal và Pierre de Fermat bắt đầu trao đổi thư từ vào những năm 1650 thì mới có những phân tích nghiêm ngặt về các sự kiện ngẫu nhiên. Giống như việc xả nước từ một con đập bị dồn nén, xác suất từ đó tràn ngập các lĩnh như tài chính, thiên văn học, luật pháp, và cả cờ bạc.Để hiểu được bản chất khó nắm bắt của khái niệm xác suất, hãy xem xét cách khái niệm này được sử dụng trong dự báo thời tiết ngày nay. Các nhà khí tượng học đưa ra dự đoán về nhiệt độ, tốc độ gió, lượng mưa, và thường là với con số phần trăm xác suất chẳng hạn như 70% cho một thời điểm và địa điểm nhất định. Nhiệt độ, tốc độ gió, lượng mưa có thể được so sánh với các giá trị thực của chúng; vì có thể đo lường giá trị thực vào một thời điểm trong tương lai để so sánh với giá trị dự báo. Thế nhưng, không tồn tại một giá trị xác suất thực để so sánh với đánh giá của người dự báo. Không có cái gọi là đồng hồ đo xác suất (probability-ometer). Hoặc là mưa, hoặc là không mưa.
Hơn nữa, như triết gia Ian Hacking nhấn mạnh, xác suất bao gồm cả sự ngẫu nhiên (chance) và sự thiếu hiểu biết (ignorance). Hãy tưởng tượng tôi tung một đồng xu và hỏi bạn về xác suất xuất hiện mặt ngửa, bạn vui vẻ trả lời “50-50”. Bây giờ, tôi tung đồng xu, liếc nhìn kết quả, vậy xác suất xuất hiện mặt ngửa của bạn là bao nhiêu? Lưu ý rằng, tôi nói xác suất của bạn, không phải xác suất. Hầu hết mọi người tỏ ra ngần ngại với câu trả lời "50-50" của mình. Nhưng sự kiện đã xảy ra, tôi đã nhìn thấy kết quả và không còn sự ngẫu nhiên nào nữa - chỉ còn sự thiếu hiểu biết của bạn. Tính huống đã chuyển từ “sự không chắc chắn ngẫu nhiên” (‘aleatory’ uncertainty) về tương lai mà chúng ta không thể biết sang “sự không chắc chắn nhận thức” (‘epistemic’ uncertainty) về hiện tại mà chúng ta không được biết. Xác suất được sử dụng cho cả 2 tình huống này.
Còn có một bài học khác ở đây. Ngay cả khi có một mô hình thống kê về những gì nên xảy ra, thì điều này luôn dựa trên các giả định chủ quan (subjective assumption) – trong trường hợp tung đồng xu, rằng có hai kết quả có khả năng xảy ra ngang nhau. Điều này có thể bị khẳng định một cách vội vàng, hấp tấp.
2. Chủ quan và khoa học
Lập luận của tôi là bất kỳ ứng dụng thực tế nào của xác suất đều liên quan đến các phán đoán chủ quan (subjective judgement). Điều này không có nghĩa là tôi có thể đưa ra bất kỳ con số nào - tôi sẽ bị chứng minh là một người đánh giá xác suất kém nếu tuyên bố với độ chắc chắn 99,9% rằng mình có thể bay khi nhảy từ mái nhà. Thế giới khách quan (objective world) xuất hiện khi xác suất và các giả định cơ bản của chúng được kiểm định với thực tế; nhưng điều đó không có nghĩa rằng bản thân xác suất là khách quan.Một số giả định được sử dụng để đánh giá xác suất sẽ có lý lẽ biện minh mạnh mẽ hơn những giả định khác. Nếu tôi đã xem xét kỹ lưỡng một đồng xu trước khi tung nó lên, nó rơi xuống một bề mặt cứng và nảy lên một cách hỗn loạn, tôi sẽ cảm thấy phán đoán 50-50 của mình là hợp lý hơn so với việc để một nhân vật mờ ám nào đó sử dụng một đồng xu được chuẩn bị từ trước. Những hạn chế tương tự này áp dụng ở bất kỳ nơi nào sử dụng xác suất – bao gồm cả trong bối cảnh khoa học.
Đây là một ví dụ về tầm quan trọng thực sự của khoa học. Ngay sau khi đại dịch COVID-19 bắt đầu, các thử nghiệm phục hồi (RECOVERY trial) đã bắt đầu thử nghiệm các liệu pháp trên những người nhập viện vì COVID-19 tại Vương quốc Anh. Trong một thí nghiệm, hơn 6.000 người được phân phối ngẫu nhiên vào 2 nhóm; nhóm 1 nhận được sự chăm sóc tiêu chuẩn được cung cấp tại bệnh viện nơi họ đang được điều trị; nhóm 2 nhận được sự chăm sóc như nhóm 1 và cộng thêm một liều dexamethasone, một loại steroid giá rẻ. Nguy cơ tử vong hàng ngày đã điều chỉnh theo độ tuổi thấp hơn 29% trong nhóm được phân bổ dexamethasone so với nhóm chỉ được chăm sóc tiêu chuẩn (khoảng tin cậy 95% là 19–49%). P-value, nghĩa là xác suất được tính toán để quan sát một rủi ro tương đối cực đoan như vậy khi chấp nhận giả thuyết vô hiệu (null hypothesis) – tức là giả thuyết không có sự khác biệt giữa 2 nhóm, được tính toán là 0.01%.
Đây là tất cả các phân tích chuẩn. Nhưng độ tin cậy và P-value phụ thuộc vào nhiều thứ hơn việc giả định giả thuyết vô hiệu là đúng. Nó cũng phụ thuộc vào tất cả các giả định trong mô hình thống kê, chẳng hạn như các quan sát là độc lập: rằng không có yếu tố nào khiến những người được điều trị trong những không gian và thời gian tương đồng có kết quả giống nhau hơn. Nhưng có nhiều yếu tố như vậy, cho dù đó là bệnh viện nơi mọi người đang được điều trị hay chế độ chăm sóc thay đổi. Giá trị chính xác cũng phụ thuộc vào tất cả những người tham gia trong mỗi nhóm có cùng xác suất sống sót cơ bản sau 28 ngày. Điều này sẽ khác nhau vì đủ mọi lý do.
Những giả định vội vàng đó không nhất thiết dẫn đến một kết quả phân tích sai. Trong trường hợp này, tín hiệu (signal) quá mạnh đến mức một mô hình cho phép, chẳng hạn, rủi ro cơ bản thay đổi giữa những người tham gia sẽ không tạo ra nhiều khác biệt đối với kết luận chung. Tuy nhiên, nếu kết quả có biên độ lớn hơn (more marginal), thì việc phân tích mở rộng về độ nhạy (sensitivity) của mô hình đối với các giả định thay thế là phù hợp.
"Tất cả các mô hình đều sai, nhưng một số thì hữu ích" (George Box). Phân tích dexamethasone đặc biệt hữu ích vì kết luận chắc chắn của nó đã thay đổi hoạt động lâm sàng và cứu sống hàng trăm nghìn người. Nhưng các xác suất mà kết luận dựa trên không “thật” (true) - chúng là sản phẩm của các giả định và phán đoán chủ quan nhưng hợp lý.
3. Xác suất – chủ quan và khách quan
Nhưng liệu những con số xác suất này có phải là các ước tính chủ quan, hay là một đặc điểm khách quan của thế giới?Xin lưu ý rằng tôi không nói về thế giới lượng tử. Ở cấp độ dưới nguyên tử, toán học chỉ ra rằng các sự kiện không có nguyên nhân có thể xảy ra với xác suất cố định (mặc dù ít nhất một cách giải thích nêu rằng ngay cả những xác suất đó cũng thể hiện mối quan hệ với các vật thể hoặc người quan sát khác, thay vì là các đặc tính nội tại của các vật thể lượng tử). Nhưng có vẻ như điều này có ảnh hưởng không đáng kể đến các sự kiện được quan sát hàng ngày trong thế giới vĩ mô.
Tôi cũng tránh những lập luận hàng thế kỷ về việc liệu thế giới, ở cấp độ phi lượng tử, có phải là tất định hay không và liệu chúng ta có ý chí tự do để tác động đến diễn biến của các sự kiện. Bất kể câu trả lời là gì, chúng ta vẫn cần phải xác định xác suất khách quan thực sự là gì.
Nhiều nỗ lực đã được thực hiện để làm điều này trong nhiều năm, nhưng đều có những hạn chế. Những nỗ lực này bao gồm xác suất tần suất (frequentist probability), một phương pháp xác định tỷ lệ các sự kiện sẽ được nhìn thấy trong vô số lần lặp lại của các tình huống giống hệt nhau – ví dụ, lặp lại cùng một thử nghiệm lâm sàng trong cùng một quần thể với cùng các điều kiện nhiều lần. Điều này có vẻ khá phi thực tế. Nhà thống kê Ronald Fisher đã đề xuất việc nghĩ về một tập dữ liệu duy nhất như một mẫu từ một quần thể giả định vô hạn (hypothetical infinite population), nhưng điều này có vẻ giống một thí nghiệm tư duy hơn là một thực tế khách quan. Hoặc có ý tưởng mang tính bán huyền bí rằng tồn tại một khuynh hướng thực sự tiềm ẩn đối với một sự kiện cụ thể xảy ra trong một bối cảnh nhất định, chẳng hạn như tôi sẽ bị đau tim trong vòng mười năm tới. Điều này có vẻ như không thể xác minh được.
Có một phạm vi hạn chế các tình huống được kiểm soát tốt, có thể lặp lại với độ phức tạp vô cùng lớn đến mức, ngay cả khi chúng về cơ bản là xác định, vẫn phù hợp với mô hình tần suất (frequentist paradigm) bằng cách có phân phối xác suất với các thuộc tính có thể dự đoán được trong thời gian dài. Chúng bao gồm các thiết bị ngẫu nhiên hóa tiêu chuẩn (standard randomizing devices), chẳng hạn như vòng quay roulette, xào bài, tung đồng xu, ném xúc xắc và quả bóng xổ số, cũng như các máy tạo số giả ngẫu nhiên (seudo-random number generators), dựa trên các thuật toán hỗn loạn, phi tuyến tính để đưa ra các con số vượt qua các bài kiểm tra về tính ngẫu nhiên.
Trong thế giới tự nhiên, chúng ta có chuyển động của tập hợp các phân tử khí, ngay cả khi tuân theo vật lý Newton, vẫn phù hợp với các quy luật thống kê; và di truyền học, trong đó sự phức tạp của quá trình chọn lọc và tái tổ hợp nhiễm sắc thể tạo ra tỷ lệ di truyền ổn định. Trong những trường hợp hạn chế này, có thể hợp lý khi giả định một xác suất giả khách quan (a pseudo-objective probability), thay vì một xác suất chủ quan (subjective probability).
Tuy nhiên, trong mọi tình huống khác mà xác suất được sử dụng – từ các lĩnh vực rộng lớn của khoa học đến thể thao, kinh tế, thời tiết, khí hậu, phân tích rủi ro, mô hình thảm họa,... – thì việc coi phán đoán của chúng ta là ước tính về xác suất “thực” là không hợp lý. Đây chỉ là những tình huống chúng ta cố gắng biểu đạt sự không chắc chắn dưới dạng xác suất, dựa trên kiến thức và phán đoán của bản thân.
4. Vấn đề của phán đoán
Tất cả những điều này chỉ làm nảy sinh thêm nhiều câu hỏi. Làm thế nào để chúng ta định nghĩa xác suất chủ quan? Và tại sao các quy luật xác suất lại hợp lý, nếu chúng dựa trên những thứ mà về cơ bản do chúng ta tạo nên? Điều này đã được thảo luận trong các tài liệu học thuật trong gần một thế kỷ, một lần nữa không có kết quả nào được thống nhất.Một trong những nỗ lực đầu tiên được thực hiện vào năm 1926 bởi nhà toán học Frank Ramsey tại Đại học Cambridge, Vương quốc Anh. Ramsey đã chứng minh rằng tất cả các quy luật xác suất (laws of probability) có thể được bắt nguồn từ sở thích đối với những trò cá cược. Các kết quả được gán giá trị lợi ích (utility), và việc đánh cược được tóm lại bởi giá trị lợi ích kỳ vọng (expected utility), vốn được xác định bởi các con số mang tính chủ quan biểu thị phần nào niềm tin – tức là các xác suất cá nhân của chúng ta. Tuy nhiên, cách diễn giải này đòi hỏi phải chỉ định các giá trị lợi ích cụ thể. Gần đây hơn, người ta đã chứng minh rằng các quy luật xác suất có thể được suy ra đơn giản bằng cách hành động nhằm tối đa hóa hiệu suất kỳ vọng khi sử dụng một quy tắc chấm điểm phù hợp, chẳng hạn như quy tắc được trình bày trong hộp văn bản “Tôi mù mờ đến mức nào?” (How ignorant am I?) bên dưới đây:
Những nỗ lực định nghĩa xác suất thường khá mơ hồ. Ví dụ, trong bài báo năm 1941-2 “The Applications of Probability to Cryptography”, Alan Turing sử dụng định nghĩa “Xác suất của một sự kiện trên một số bằng chứng nhất định là tỷ lệ các trường hợp mà sự kiện đó có thể được mong đợi xảy ra dựa trên bằng chứng đó”. Điều này thừa nhận rằng xác suất thực tế dựa trên kỳ vọng – phán đoán của con người. Nhưng khi nói đến “các trường hợp”, Turing hàm ý rằng các trường hợp của cùng quan sát hay của cùng phán đoán?
Cái sau có điểm chung với định nghĩa của chủ nghĩa tần suất về xác suất khách quan, chỉ khác là lớp các quan sát tương tự lặp lại được thay thế bằng lớp các phán đoán chủ quan tương tự lặp lại. Theo quan điểm này, nếu khả năng mưa được đánh giá là 70%, điều này đặt nó vào tập hợp các dịp mà người dự báo gán xác suất 70%. Bản thân sự kiện này được kỳ vọng sẽ xảy ra trong 70% các dịp như vậy. Đây có lẽ là định nghĩa yêu thích của tôi. Nhưng sự mơ hồ của xác suất được chứng minh rõ ràng bởi thực tế là, sau gần bốn thế kỷ, có rất nhiều người sẽ không đồng ý với tôi về điều đó.
5. Cách tiếp cận thực dụng
Khi tôi còn là sinh viên vào những năm 1970, người cố vấn của tôi, nhà thống kê học Adrian Smith, đã dịch “Lý thuyết xác suất” (Theory of Probability) của nhà toán học người Ý Bruno de Finetti. De Finetti đã phát triển các ý tưởng về xác suất chủ quan vào khoảng thời gian tương tự như Ramsey, nhưng hoàn toàn độc lập. Cuốn sách đó bắt đầu bằng tuyên bố khiêu khích: "Xác suất không tồn tại", một ý tưởng đã có ảnh hưởng sâu sắc đến suy nghĩ của tôi trong 50 năm qua.Tuy nhiên, trên thực tế, có lẽ chúng ta không cần phải quyết định xem liệu xác suất khách quan có thực sự tồn tại trong thế giới phi lượng tử không. Thay vào đó, chúng ta có thể áp dụng cách tiếp cận thực dụng. De Finetti đã đưa ra lập luận thuyết phục nhất cho cách tiếp cận này trong tác phẩm năm 1931 của ông về "Khả năng trao đổi" (exchangeability), dẫn đến một định lý nổi tiếng mang tên ông. Một chuỗi sự kiện được coi là có thể trao đổi (exchangeable) nếu xác suất chủ quan của chúng ta đối với mỗi chuỗi không bị ảnh hưởng bởi thứ tự quan sát của chúng ta. De Finetti đã chứng minh một cách xuất sắc rằng giả định này về mặt toán học tương đương với việc hành động như thể các sự kiện là độc lập, mỗi sự kiện có một xác suất xảy ra và rằng sự không chắc chắn của chúng ta về xác suất chưa biết đó được thể hiện bằng một phân phối xác suất nhận thức chủ quan (a subjective, epistemic probability distribution). Điều này thật đáng chú ý: nó cho thấy rằng, bắt đầu từ một biểu hiện cụ thể nhưng hoàn toàn chủ quan của niềm tin, chúng ta nên hành động như thể các sự kiện được thúc đẩy bởi xác suất khách quan.
Thật phi thường khi một khối lượng công trình quan trọng, làm nền tảng cho toàn bộ khoa học thống kê và nhiều hoạt động khoa học và kinh tế khác, lại nảy sinh từ một ý tưởng khó nắm bắt như vậy. Và vì vậy tôi sẽ kết luận bằng câu cách ngôn của riêng mình:
Xác suất có lẽ không tồn tại - nhưng thường hữu ích khi hành động như thể nó tồn tại.
Probability probably does not exist - but it is often useful to act as if it does.
11
|
12/18/2024 11:00:12 PM