Seoul, Hàn Quốc, 9–15 tháng 3 năm 2016 | |
---|---|
9 tháng 3 năm 2016 | |
Hiệp thứ nhất | AlphaGo thắng. |
10 tháng 3 năm 2016 | |
Hiệp thứ hai | AlphaGo thắng. |
12 tháng 3 năm 2016 | |
Hiệp thứ ba | AlphaGo thắng. |
13 tháng 3 năm 2016 | |
Hiệp thứ tư | Lee Sedol thắng. |
15 tháng 3 năm 2016 | |
Hiệp thứ năm | AlphaGo thắng. |
AlphaGo đấu với Lee Sedol, hoặc Trận thách đấu của Google DeepMind (Google DeepMind Challenge Match), là một trận đấu cờ vây gồm 5 ván giữa Lee Sedol - người từng 18 lần vô địch thế giới - và AlphaGo, một phần mềm cờ vây máy tính được phát triển bởi Google DeepMind, được tổ chức tại Seoul, Hàn Quốc, từ ngày 9 đến ngày 15 tháng 3 năm 2016. AlphaGo thắng tất cả trừ ván thứ tư;[1] tất cả các ván đều kết thúc bằng việc nhận thua.[2] Trận đấu này được so sánh với trận đấu cờ vua lịch sử giữa Deep Blue và Garry Kasparov vào năm 1997.
Người thắng trận đấu dự kiến sẽ nhận được số tiền thưởng 1 triệu USD. Từ khi AlphaGo giành chiến thắng, Google DeepMind tuyên bố giải thưởng sẽ được trao tặng cho các tổ chức từ thiện, bao gồm UNICEF và các tổ chức về cờ vây.[3] Lee nhận được 170.000 USD (150.000 dành cho việc tham gia trận đấu năm ván và khoản thưởng 20.000 USD cho một ván thắng).[4]
Sau trận đấu, Hiệp hội cờ vây Hàn Quốc đã phong cho AlphaGo danh hiệu cao nhất của kì thủ cờ vây – một danh hiệu "9 dan danh dự". Danh hiệu này được đưa ra như một sự công nhận những "nỗ lực chân thành" của AlphaGo để đạt tới mức độ bậc thầy trong cờ vây.[5] Trận đấu này được chọn bởi tạp chí Science là một trong những á quân của giải thưởng Đột phá của Năm được công bố vào ngày 22 tháng 12 năm 2016.[6]
Cờ vây là một trò chơi phức tạp, với việc đòi hỏi trực giác, sự sáng tạo và tư duy chiến lược.[7][8] Môn thể thao này từ lâu đã được coi là một thách thức khó khăn trong lĩnh vực trí tuệ nhân tạo (AI), và nó tỏ ra khó khăn[9] để giải quyết hơn một cách đáng kể so với cờ vua. Nhiều chuyên gia trong lĩnh vực trí tuệ nhân tạo cho rằng cờ vây đòi hỏi nhiều yếu tố bắt chước suy nghĩ của con người hơn cờ vua.[10] Nhà toán học I. J. Good viết trong năm 1965:[11]
Cờ vây trên một chiếc máy tính? – Để lập trình cho một chiếc máy tính chơi được một ván cờ vây hợp lý, chứ không phải chỉ đơn thuần là một ván cờ đúng luật – sẽ là cần thiết với việc chính thức hoá các nguyên tắc của chiến lược tốt, hoặc thiết kế một chương trình học tập. Các nguyên tắc này tỏ ra định tính và bí ẩn hơn cờ vua, và phụ thuộc nhiều hơn vào sự phán xét. Vì vậy, tôi nghĩ rằng sẽ còn khó khăn hơn cho một chương trình máy tính để chơi một ván cờ hợp lý của cờ vây hơn là của cờ vua.
Trước năm 2015,[12] các chương trình chơi cờ vây tốt nhất chỉ đạt đến mức độ dan nghiệp dư.[13] Trên cỡ bàn nhỏ 9×9, máy tính ở tình trạng tốt hơn, và một vài phần mềm đã giành chiến thắng một phần nhỏ của các ván đấu 9×9 trước các kì thủ chuyên nghiệp. Trước AlphaGo, một số nhà nghiên cứu đã khẳng định rằng máy tính sẽ không bao giờ đánh bại được những người hàng đầu trong cờ vây.[14] Elon Musk, một nhà đầu tư ngay từ ban đầu của Deepmind, đã phát biểu vào năm 2016 rằng những người giỏi nhất trong lĩnh vực này nghĩ rằng AI sẽ phải mất 10 năm nữa mới đạt được một chiến thắng với một kì thủ cờ vây chuyên nghiệp hàng đầu.[15]
Trận đấu giữa AlphaGo và Lee Sedol được so sánh với trận đấu cờ vua năm 1997 giữa Deep Blue đấu với Garry Kasparov. Chiến thắng của máy tính Deep Blue của IBM trước đương kim vô địch Kasparov được xem là điểm nhấn mang tính biểu tượng, nơi mà máy tính trở nên tốt hơn con người trong cờ vua.[16]
AlphaGo là chương trình có sự khác biệt đáng kể nhất so với những nỗ lực AI trước đó ở chỗ nó được áp dụng mạng thần kinh nhân tạo, trong đó phương pháp tự giải quyết vấn đề bằng cách đánh giá, thử nghiệm và rút kinh nghiệm (evaluation heuristics) không bị mã hóa cứng bởi con người, mà thay vào đó là sự tự học ở mức độ lớn bởi bản thân chương trình, thông qua hàng chục triệu ván cờ vây cũng như những ván cờ tự chơi của chính nó. Thậm chí đội ngũ phát triển AlphaGo còn không thể chỉ ra được cách mà AlphaGo đánh giá các vị trí quân cờ và chọn bước đi tiếp theo. Phương pháp duyệt cây Monte Carlo cũng được dùng như phương pháp chính để nâng cao hiệu quả lý luận của chương trình.
Các kết quả nghiên cứu có liên quan đang được áp dụng cho các lĩnh vực như khoa học nhận thức, nhận dạng mẫu và học máy.[17]
AlphaGo đánh bại nhà vô địch châu Âu Phiền Huy (Fan Hui), một kì thủ chuyên nghiệp 2 dan, với tỉ số 5–0 vào tháng 10 năm 2015, đây là lần đấu tiên một thực thể AI đánh thắng một kì thủ con người chuyên nghiệp trong một ván cờ với cỡ bàn lớn nhất và không sử dụng lợi thế.[18][19] Một số nhà bình luận nhấn mạnh khoảng cách lớn về thực lực giữa Phiền và Lee, người được xếp hạng 9 dan chuyên nghiệp.[20] Các chương trình máy tính Zen và Crazy Stone trước đó đã đánh bại những kì thủ là con người đạt 9 dan chuyên nghiệp với lợi thế chấp từ 4 đến 5 quân.[21][22] Chuyên gia về AI người Canada Jonathan Schaeffer, cho ý kiến sau chiến thắng trước Phiền, so sánh AlphaGo với một "thần đồng" vẫn còn thiếu kinh nghiệm, và cho rằng, "thành tích thực sự sẽ là khi chương trình chơi với một kì thủ trong loạt những người cao cấp thực sự." Ông sau đó tin rằng Lee sẽ chiến thằng trận đấu vào tháng 3 năm 2016.[19] Hajin Lee, một kì thủ cờ vây chuyên nghiệp và là tổng thư ký của Liên đoàn cờ vây quốc tế, nhận xét rằng cô "rất vui mừng" trước viễn cảnh một thực thể AI thách thức Lee, và nghĩ rằng hai kì thủ có một cơ hội chiến thắng ngang nhau.[19]
Sau kết quả của trận đấu trước AlphaGo, Phiền Huy lưu ý rằng ván đấu đã dạy anh trở thành một kì thủ tốt hơn, và thấy được những thứ mà anh chưa từng thấy trước đó. Tới tháng 3 năm 2016, Wired báo cáo rằng thứ hạng của anh ta đã tăng từ 633 lên tới top 300.[23]
Các chuyên gia cờ vây đã tìm ra những lỗi trong các nước đi của AlphaGo trước Phiền, đặc biệt chú ý đế sự thiếu nhận thức trên toàn bàn cờ, nhưng trước ván đấu mở màn trước Lee, người ta không biết chương trình đã cải thiện các ván đấu được bao nhiêu từ trận đấu vào tháng 10.[20][24] AlphaGo không được thiết kế để đấu với Lee Sedol, điều khó có thể thực hiện được trong bất kì trường hợp nào, bởi việc huấn luyện AlphaGo cần tới hàng chục triệu ván đấu, và một vài trăm hoặc vài nghìn ván đấu từ một kì thủ cụ thể sẽ không đủ để thay thế lối chơi của AlphaGo. Thay vào đó, việc huấn luyện của AlphaGo được bắt đầu với những ván đấu của những người chơi mạnh thuộc cấp độ nghiệp dư từ các máy chủ cờ vây trên internet, sau những ván mà AlphaGo luyện tập bằng cách tự đấu với chính mình; không có ván cờ nào của Lee Sedol có trong dữ liệu huấn luyện của AlphaGo.[25][26]
AlphaGo là một chương trình máy tính được phát triển bởi Google DeepMind để có thể chơi môn thể thao cờ vây. Thuật toán của AlphaGo sử dụng một sự kết hợp của các kỹ thuật máy học và duyệt cây, kết hợp với đào tạo mở rộng, cả từ nước đi của con người và máy tính. Hệ thống mạng thần kinh nhân tạo ban đầu được nạp chương trình mồi (bootstrapping) từ sự tinh thông cách chơi trong một ván cờ của con người. AlphaGo ban đầu được huấn luyện bắt chước cách chơi của con người bằng cách cố gắng đi những nước đi giống với những kì thủ xuất sắc trong lịch sử trò chơi được ghi chép lại, sử dụng một cơ sở dữ liệu của KGS Go Server chứa khoảng 30 triệu nước cờ từ 160.000 ván cờ của những người chơi có trình độ từ 6 đến 9 dan KGS.[12][27] Một khi đã đạt đến một mức độ nhất định về trình độ, nó được tiếp tục đào tạo bằng cách thiết lập để chơi một số lượng lớn các ván cờ đối đầu với các phiên bản khác của bản thân, sử dụng học tăng cường để cải thiện cách chơi của nó.[28] Hệ thống này không sử dụng một "cơ sở dữ liệu" các bước đi để chơi. Như mộtr trong những người sáng tạo nên AlphaGo giải thích:[29]
Mặc dù chúng tôi đã lập trình cỗ máy này để chơi cờ, chúng tôi không biết đâu sẽ là nước đi tiếp theo của nó. Các nước đi của nó là một hiện tượng mang tính đột sinh từ quá trình huấn luyện. Chúng tôi chỉ tạo các bộ dữ liệu và các thuật toán huấn luyện. Nhưng các nước đi mà nó sẽ thực hiện nằm ngoài sự kiểm soát của chúng tôi—và tốt hơn những nước đi mà chúng ta, những kì thủ cờ vây, sẽ thực hiện.
Phiên bản AlphaGo đấu với Lee sử dụng một số lượng tương tự của sức mạnh tính toán như trong trận đấu với Phiền Huy,[30] trận mà chúng sử dụng tới 1.202 CPU và 176 GPU.[12] The Economist báo cáo rằng nó sử dụng 1.920 CPU và 280 GPU.[31] Google cũng đã tuyên bố rằng các bộ xử lý tensor (tensor processing unit) độc quyền của nó đã được sử dụng trong trận đấu với Lee Sedol.[32]
Lee Sedol là một kì thủ cờ vây chuyên nghiệp 9 dan[33] và là một trong những kì thủ mạnh nhất trong lịch sử cờ vây. Anh bắt đầu sự nghiệp vào năm 1996 (thăng cấp bậc dan chuyên nghiệp ở tuổi 12), thắng 18 giải đấu quốc tế kể từ đó.[34] Anh là một "anh hùng dân tộc" tại quê hương Hàn Quốc của mình, được biết đến với lối đánh khác thường và sáng tạo.[35] Lee Sedol ban đầu dự đoán sẽ đánh bại AlphaGo trong một trận đấu "long trời lở đất".[35] Vài tuần trước trận đấu, anh đã đạt được danh hiệu Hàn Quốc Myungin, một giải đấu chính.[36]
Trận đấu được tổ chức theo thể thức đấu 5 ván với giải thưởng lớn là 1 triệu USD,[3] sử dụng Luật Trung Quốc với 7.5 điểm komi.[4] Trong mỗi ván, mỗi người chơi có một khoảng thời gian là 2 giờ cho các nước đi, sau đó là giai đoạn byo-yomi, mỗi người chơi có 60 giây để đưa ra mỗi nước đi, không được phép vượt quá 60 giây quá ba lần.[4] Mỗi ván đấu bắt đầu vào 13:00 KST (04:00 GMT).[37]
Trận đấu được tổ chức tại Four Seasons Hotel ở Seoul, Hàn Quốc vào tháng 3 năm 2016 và được quay truyền hình trực tiếp với phần bình luận của Michael Redmond (9-dan chuyên nghiệp) và Chris Garlock.[38][39][40] Aja Huang, một thành viên của đội ngũ DeepMind và là một kì thủ cờ vây nghiệp dư 6-dan, phụ trách việc đặt quân cờ bàn cờ vây cho AlphaGo, được chạy thông qua nền tảng điện toán đám mây Google Cloud Platform với máy chủ đặt tại Mỹ.[41]
Ván | Ngày | Quân đen | Quân trắng | Kết quả | Số nước đi |
---|---|---|---|---|---|
1 | 9 tháng 3 năm 2016 | Lee Sedol | AlphaGo | Lee Sedol chịu thua | 186 (Ván thứ nhất) |
2 | 10 tháng 3 năm 2016 | AlphaGo | Lee Sedol | Lee Sedol chịu thua | 211 (Ván thứ hai) |
3 | 12 tháng 3 năm 2016 | Lee Sedol | AlphaGo | Lee Sedol chịu thua | 176 (Ván thứ ba) |
4 | 13 tháng 3 năm 2016 | AlphaGo | Lee Sedol | AlphaGo chịu thua | 180 (Ván thứ tư) |
5 | 15 tháng 3 năm 2016 | Lee Sedol[ct 1] | AlphaGo | Lee Sedol chịu thua | 280 (Ván thứ năm) |
Kết quả: AlphaGo 4 – 1 Lee Sedol | |||||
^ chú thích 1: Trong ván thứ 5, theo các quy định chính thức, người ta dự định rằng sự lựa chọn màu sắc sẽ được thực hiện một cách ngẫu nhiên.[42] Tuy nhiên, trong cuộc họp báo sau ván đấu thứ tư, Lee yêu cầu "... từ khi tôi thắng với quân trắng, tôi thực sự tin rằng ván thứ năm này tôi có thể thắng với quân đen, vì chiến thắng với quân đen đáng giá hơn nhiều."[43] Hassabis đồng ý với đề xuất của anh. |
AlphaGo (trắng) thắng ván đầu tiên. Lee giành quyền kiểm soát trong hầu hết ván đấu, nhưng AlphaGo đạt được lợi thế trong 20 phút cuối cùng và Lee chịu thua.[44] Lee nói sau đó rằng anh đã phạm phải một sai lầm nghiêm trọng ở khai cuộc; anh nói rằng chiến lược của máy tính trong giai đoạn đầu của ván đấu là "tuyệt vời" và rằng AI đã thực hiện một nước đi bất thường mà không có người chơi cờ vây là con người nào sẽ thực hiện điều đó.[44] David Ormerod, nhận xét về ván đấu trên Go Game Guru, mô tả nước đi thứ bảy của Lee như "một nước lạ để kiểm tra sức mạnh của AlphaGo trong giai đoạn khai cuộc", biểu thị đặc trưng của nước đi này như một lỗi sai và phản ứng của AlphaGo là "chính xác và hiệu quả". Ông mô tả vị trí quân cờ của AlphaGo tỏ ra thuận lợi trong phần đầu của trận đấu, xem xét rằng Lee bắt đầu quay trở lại với nước thứ 81, trước khi thực hiện những nước "có vấn đề" tại nước thứ 119 và 123, tiếp nối với một nước "thua cuộc" ở nước thứ 129.[45] Kì thủ cờ vây chuyên nghiệp Cho Hanseung nhận xét rằng ván đấu của AlphaGo đã được cải thiện đáng kể từ khi nó đánh bại Phiền Huy vào tháng 10 năm 2015.[45] Michael Redmond mô tả ván đấu của máy tính này là căng thẳng hơn so với lần đối đầu với Phiền.[46]
Theo kì thủ cờ vây kì cựu 9-dan Kim Seong-ryong, Lee dường như bị kinh ngạc bởi nước đi mạnh mẽ của AlphaGo ở nước thứ 102.[47] Sau khi AlphaGo đi nước thứ 102 của ván đấu, Lee đã nghiền ngẫm những lựa chọn của mình trong hơn 10 phút.[47]
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 nước đầu |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nước 100–186. |
AlphaGo (đen) thắng ván thứ hai. Lee sau đó nói rằng "AlphaGo đã chơi một ván đấu gần như hoàn hảo",[48] "ngay từ những nước đầu của ván đấu, tôi đã không cảm thấy có một thời điểm nào mà tôi đang dẫn trước".[49] Một trong những người sáng tạo ra AlphaGo, Demis Hassabis, nói rằng hệ thống đã tự tin vào một chiến thắng từ nửa sau của ván đấu, mặc dù các nhà bình luận chuyên nghiệp không thể cho biết được ai đang dẫn trước.[49]
Michael Redmond (9p) lưu ý rằng quân thứ 19 của AlphaGo (nước thứ 37) là "sáng tạo" và "độc đáo".[29] Lee mất một thời gian dài bất thường để phản ứng với nước đi.[29] An Younggil (8p) gọi nước thứ 37 của AlphaGo là "một nước đâm vai (shoulder hit) hiếm và có toan tính" nhưng nói rằng nước phản công của Lee là "tinh tế". Ông nói rằng sự kiểm soát đó được đối đáp qua lai giữa hai bên một vài lần trước khi thu quan, và đặc biệt ca ngợi nước thứ 151, 157 và 159 của AlphaGo, gọi chúng là những nước đi "sáng chói".[50]
AlphaGo cho thấy những sự dị thường và các nước đi từ một góc nhìn rộng hơn, mà các kì thủ cờ vây chuyên nghiệp mô tả là trông như nước đi sai lầm ở cái nhìn đầu tiên, nhưng là một chiến lược có chủ định trong nhận thức.[51] Như một trong những người sáng tạo của hệ thống giải thích, AlphaGo không cố gắng tối đa hóa điểm hoặc số đất chiến thắng của mình, nhưng sẽ cố gắng phát huy tối đa khả năng chiến thắng của mình.[29][52] Nếu AlphaGo phải lựa chọn giữa một kịch bản mà nó sẽ giành chiến thắng với khoảng cách 20 mục với xác suất 80% và một kịch bản khác mà nó sẽ thắng một mục rưỡi với xác suất 99%, nó sẽ chọn lựa chọn sau, ngay cả khi phải từ bỏ điểm số của mình để đạt được.[29] Đặc biệt, nước thứ 167 bởi AlphaGo có vẻ như tạo cho Lee một cơ hội đối đầu và được các bình luận viên quả quyết rằng có vẻ như là một sai lầm rõ ràng. An Younggil nói "Vì vậy, khi AlphaGo đi một nước đi có vẻ như chùng xuống, chúng ta có thể coi đó là một sai lầm, nhưng có lẽ nó nên được nhìn nhận chính xác hơn như là một lời tuyên bố chiến thắng?"[53]
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 nước đầu |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nước 100-199 |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nước 200-211 |
AlphaGo (trắng) thắng ván thứ ba.[54]
Sau ván thứ hai, vẫn còn có những nghi ngờ mạnh mẽ giữa các kì thủ nếu như AlphaGo thật sự là một kì thủ con người mạnh mẽ trong ý nghĩ rằng một con người có thể đạt tới trình độ đó. Ván đấu thứ ba được mô tả là đã loại bỏ hoàn toàn nghi ngờ này; với nhận xét của các nhà phân tích:
AlphaGo đã chiến thắng một cách thuyết phục, như để loại bỏ mọi nghi ngờ về sức mạnh của mình trong tâm trí của các kì thủ có kinh nghiệm. Thực tế, nó đã chơi rất tốt đến mức gần như đáng sợ... Trong việc buộc AlphaGo chịu một cuộc tấn công một chiều rất nghiêm trọng, Lee đã làm bộc lộ sức mạnh cho đến nay vẫn không bị phát hiện của nó... Lee đã không giành được đủ lợi thế từ cuộc tấn công của mình... Một trong những bậc thầy vĩ đại nhất của trung cuộc vừa trở nên vượt trội hơn hẳn trong sự rạch ròi trắng đen.[53]
Theo An Younggil (8p) và David Ormerod, ván đấu cho thấy rằng "AlphaGo đơn thuần mạnh hơn bất kì người chơi cờ vây là con người nào từng được biết đến."[53] AlphaGo đã cho thấy việc có thể điều hướng các tình huống phức tạp được gọi là kō mà không xuất hiện trong hai ván đấu trước.[55] An và Ormerod xem xét nước thứ 148 đặc biệt đáng chú ý: ở giữa một cuộc chiến ko phức tạp, AlphaGo biểu thị sự "tự tin" vừa đủ rằng nó đã chiến thắng cuộc chiến để đi một nước lớn ở vị trí khác.[53]
Lee, cầm quân đen, khai cuộc với bố cục Đại Trung Quốc (High Chinese) và tạo ra một khu vực ảnh hưởng rộng lớn của quân đen, mà AlphaGo xâm lược ở nước thứ 12. Điều này đòi hỏi chương trình phải bảo vệ một nhóm quân yếu, mà nó đã thành công.[53] An Younggil mô tả nước đi thứ 31 của Lee có thể là "nước thua cuộc"[53] và Andy Jackson của Liên đoạn cờ vây Hoa Kỳ cho rằng kết quả đã được quyết định bởi nước thứ 35.[52] AlphaGo đã giành quyền kiểm soát ván đấu bằng nước thứ 48, và buộc Lee vào thế phòng thủ. Lee phản công tại nước thứ 77/79, nhưng phản ứng của AlphaGo tỏ ra hiệu quả và nước thứ 90 của nó đã thành công trong việc đơn giản hóa vị trí này. Sau đó nó đã giành được một vùng chiếm đóng rộng lớn ở phía dưới bàn cờ, củng cố vị thế của mình với những nước từ 102 tới 112, được mô tả bởi An bẳng cụm từ "phức tạp".[53] Lee tấn công một lần nữa ở các nước 115 và 125, nhưng những phản ứng của AlphaGo lại hiệu quả thêm một lần nữa. Lee cuối cùng đã cố gắng tổ chức một trận đấu kiếp ko phức tạp từ nước thứ 131, mà không buộc được chương trình phạm bất kì sai lầm nào, và anh chịu thua tại nước thứ 176.[53]
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 nước đầu |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nước 100-176 (122 ở 113, 154 ở , 163 ở 145, 164 ở 151, 166 and 171 ở 160, 169 ở 145, 175 ở ) |
Lee (trắng) thắng ván thứ tư. Theo Demis Hassabis của DeepMind, AlphaGo đã phạm phải một lỗi sai ở nước thứ 79, lúc đó nó đã ước tính có một cơ hội 70% để giành chiến thắng. Tại nước thứ 87, chỉ số ước tính của chương trình đột nhiên giảm mạnh.[56][57] David Ormerod mô tả đặc trưng của các nước đi từ 87 tới 101 như điển hình của những lỗi của các phần mềm dựa trên Monte Carlo.[58]
Lee chọn chơi một loại chiến lược cực đoan, được biết với tên gọi amashi, để đáp trả sở thích rõ ràng của AlphaGo cho Sōba Go (cố gắng giành chiến thắng bằng nhiều lợi thế nhỏ khi có cơ hội), chiếm lấy lãnh thổ ở biên thay vì trung tâm.[58] Bằng cách này, mục đích rõ ràng của anh là để buộc ván đấu bước vào một dạng tình huống "được ăn cả ngã về không" đặc trưng — một điểm yếu khả thi đối với một đối thủ mạnh ở các cách chơi đổi quân, và một trong số đó có thể khiến năng lực quyết định lợi thế ít ỏi của AlphaGo không thích hợp nếu xét trên tổng thể.[58]
11 nước đi đầu tiên cũng giống như ván đấu thứ hai, khi Lee cũng cầm quân trắng. Trong khai cuộc, Lee tập trung vào việc chiếm lãnh thổ ở các cạnh và góc của bàn cờ, cho phép AlphaGo đạt được ảnh hưởng ở phía trên và trung tâm bàn cờ. Lee sau đó xâm chiếm khu vực ảnh hưởng của AlphaGo ở phía trên với các nước từ 40 tới 48, tiếp nối sau đó với chiến lược amashi. AlphaGo phản ứng với một nước đâm vai tại nước thứ 47, sau đó hy sinh bốn quân ở vị trí khác, và giành được thế chủ động với những nước từ 47 tới 53 và 69. Lee thử AlphaGo bằng những nước từ 72 tới 76 mà không phạm sai lầm, và tại thời điểm này của ván đấu, các nhà bình luận bắt đầu cảm thấy một khả năng thua cuộc dành cho Lee. Tuy nhiên, một nước đi quân trắng ở nước thứ 78, được mô tả là "một tesuji sáng chói", cũng như một nước mạnh mẽ tiếp theo của quân trắng tại nước thứ 82 đã hoàn toàn làm đảo chiều ván đấu.[58] Nước đi này đã phát triển một vùng đệm cho quân trắng ở trung tâm và làm tăng độ phức tạp của ván đấu.[59] Phản ứng ban đầu của AlphaGo ở các nước thứ 83 tới 85 là thích hợp, nhưng tình hình sau đó khiêu khích AlphaGo thực hiện các nước đi rất tệ để đáp trả từ nước thứ 87 tới 101. Lee vượt lên dẫn trước với nước thứ 92, và An Younggil mô tả nước thứ 105 của quân đen như nước thua cuộc cuối cùng. Mặc dù có chiến thuật tốt trong quá trình thực hiện các nước đi từ 131 tới 141, AlphaGo cho thấy việc không thể cứu vãn trong thu quan và chịu thua.[58] Sự chịu đầu hàng của AlphaGo đã được kích hoạt khi nó đánh giá cơ hội của mình để chiến thắng ít hơn 20%; tính năng này được thiết kế để phù hợp với quyết định của các kì thủ chuyên nghiệp mà chịu thua còn hơn chơi tới cuối ván khi vị trí quân của họ tỏ ra không thể cứu được nữa.[59]
Kì thủ 9 dan chuyên nghiệp người Trung Quốc Cổ Lực mô tả nước thứ 78 của quân trắng như một "nước đi thần thánh" và cho biết rằng nước đi này đã hoàn toàn không được anh lường trước.[58] An Younggil trên Go Game Guru đã kết luận rằng ván đấu như "một kiệt tác bởi Lee Sedol và sẽ gần như chắc chắn trở thành một ván đấu nổi tiếng trong lịch sử của cờ vây".[58] Lee nhận xét sau trận đấu rằng anh cảm thấy AlphaGo mạnh nhất khi cầm quân trắng (đi sau).[60] Vì lý do này, anh yêu cầu được cầm quân đen trong ván thứ năm, việc được coi là rủi ro hơn.
David Ormerod của Go Game Guru nói rằng mặc dù vẫn chưa có một phân tích nào về cách chơi của AlphaGo trong khoảng nước đi từ 79–87 tại thời điểm đó, ông tin rằng đó là một kết quả của một điểm yếu được biết đến trong các thuật toán chơi cờ sử dụng phương pháp duyệt cây Monte Carlo. Về bản chất, phương pháp tìm kiếm này cố gắng để tỉa các trình tự ít có liên quan. Trong một vài trường hợp, một nước đi có thể dẫn đến một chuỗi các nước đi vô cùng cụ thể đóng vai trò quan trọng, nhưng được bỏ qua khi cây được tỉa, và do đó kết quả này đã "tắt radar tìm kiếm".[61]
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 nước đầu |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nước 100-180 (177 ở , 178 ở ) |
AlphaGo (trắng) thắng ván thứ năm.[62] Trận đấu được mô tả là khá sít sao. Hassabis nói rằng kết quả hiện rõ sau khi chương trình phạm phải một "sai lầm tồi tệ" ở đầu ván đấu.[62]
Lee, cầm quân đen, khai cuộc với một hình cờ tương tự với ván đầu tiên và sau đó bắt đầu khoanh vùng lãnh thổ ở biên phải và góc trên bên trái – một chiến thuật tương tự với chiến thuật mà anh đã sử dụng thành công trong ván thứ tư – trong khi AlphaGo đạt được ảnh hưởng tại trung tâm bàn cờ. Ván đấu tiếp tục kể cả cho đến khi quân trắng thực hiện các nước đi từ 48 tới 58, khi mà AlphaGo chơi ở góc dưới bên phải. Những nước đi này khiến quân trắng thất thế một cách không cần thiết trong các cuộc đấu kiếp và aji, cho phép Lee vươn lên dẫn trước.[63] Michael Redmond (9p) đã dự đoán rằng có lẽ AlphaGo đã quên mất "cú đè của bia mộ" tesuji của quân đen. Con người được dạy để nhận ra những hình cờ cụ thể, nhưng đó là một chuỗi vô vàn các nước đi nếu phải được tính toán từ đầu.
AlphaGo sau đó bắt đầu phát triển vùng phía trên bàn cờ cũng như phần trung tâm, và phòng thủ một cách xuất sắc trước một đợt tấn công của Lee từ nước thứ 69 tới 81, mà David Ormerod nêu bật điểm đặc trưng của nó là quá thận trọng. Ở nước thứ 90 của quân trắng, AlphaGo đã lấy lại thế cân bằng, và sau đó thực hiện một loạt nước đi mà theo mô tả của Ormerod là "bất thường... nhưng ấn tượng một cách tinh tế" giúp nó giành được một chút lợi thế. Lee đã thử một nỗ lực liều lĩnh muộn màng với các nước thứ 167 và 169, nhưng sự phòng thủ của AlphaGo đã thành công. An Younggil chú thích nước thứ 154, 186 và 194 của quân trắng là đặc biệt mạnh mẽ, và chương trình thực hiện một phần thu quan hoàn hảo, duy trì thế dẫn trước cho tới khi Lee chịu thua.[63]
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
99 nước đầu |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nước 100-199 (118 ở 107, 161 ở ) |
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nước 200-280 (240 ở 200, 271 ở , 275 ở , 276 ở ) |
Video trực tiếp của các ván đấu và phần bình luận đồng hành được phát sóng ở Hàn Quốc, Trung Quốc, Nhật Bản và Vương quốc Anh. Phần đưa tin tiếng Hàn được thực hiện sẵn thông qua Baduk TV.[64] Phần đưa tin tiếng Trung của ván thứ nhất với phần bình luận của hai kì thủ 9-dan Cổ Lực và Kha Khiết được cung cấp tương ứng bởi Tencent và LeTV, đạt khoảng 60,000,000 lượt xem.[65] Phần đưa tin trực tuyến tiếng Anh trình bày bởi kì thủ 9-dan người Mỹ Michael Redmond và Chris Garlock, một phó chủ tịch của Hiệp hội cờ vây Hoa Kỳ, đạt trung bình 80,000 lượt xem với số lượng cao nhất là 100,000 lượt xem vào gần cuối ván thứ nhất.[66]
Chiến thắng của AlphaGo là một cột mốc quan trọng trong nghiên cứu trí tuệ nhân tạo.[67] Cờ vây trước đây đã được coi là một vấn đề khó khăn trong học máy, được dự kiến sẽ vượt ra khỏi tầm với của công nghệ trong thời đại này.[67][68][69] Hầu hết các chuyên gia cho rằng một chương trình cờ vây mạnh như AlphaGo phải ít nhất năm năm nữa mới có thể đạt được;[70] một số chuyên gia cho rằng sẽ tốn ít nhất một thập kỷ trước khi máy tính đánh bại các nhà vô địch trong bộ môn cờ vây.[71][72] Hầu hết các nhà quan sát tại thời điểm bắt đầu trận đấu năm 2016 đã dự đoán một chiến thắng cho Lee trước AlphaGo.[67]
Với các trò chơi như cờ đam (checkers), cờ vua và bây giờ là cờ vây đã được thắng bởi người chơi là máy tính, những chiến thắng ở những bộ môn cờ phổ biến không còn có thể đóng vai trò chính trong trí tuệ nhân tạo theo cái cách mà chúng từng thực hiện. Murray Campbell, một thành viên của đội ngũ vận hành Deep Blue gọi chiến thắng của AlphaGo là "sự kết thúc của một kỉ nguyên... (mục tiêu chinh phục) những trò chơi về cờ ít nhiều đã hoàn thành và giờ là lúc bước tiếp."[67]
Khi so sánh với Deep Blue hoặc với Watson, các thuật toán cơ bản của AlphaGo có khả năng vì mục đích tổng quát nhiều hơn, và có thể là bằng chứng cho thấy cộng đồng khoa học đang đạt những bước tiến hướng tới trí tuệ nhân tạo tổng quát (artificial general intelligence).[73] Một số nhà bình luận tin rằng chiến thắng của AlphaGo tạo ra một cơ hội tốt cho xã hội để bắt đầu thảo luận về việc chuẩn bị cho các tác động trong tương lai có thể có của máy móc với trí tuệ có mục đích tổng quát. Tháng 3 năm 2016, nhà nghiên cứu trí tuệ nhân tạo Stuart Russell nói rằng "Các phương thức trí tuệ nhân tạo đang tiến triển nhanh hơn mong đợi, (mà) làm cho câu hỏi về kết quả dài hạn trở nên cấp bách hơn," nói thêm rằng "để đảm bảo việc những hệ thống trí tuệ nhân tạo ngày càng mạnh mẽ vẫn hoàn toàn nằm dưới sự kiểm soát của con người... có rất nhiều việc phải làm."[74] Một số học giả, chẳng hạn như nhà vật lý Stephen Hawking, cảnh báo rằng một số trí tuệ nhân tạo tự hoàn thiện được phát triển trong tương lai có thể đạt được trí tuệ tổng quát thực tế, dẫn tới một sự tiếp quản của trí tuệ nhân tạo không mong đợi; một vài học giả khác không đồng ý: chuyên gia về trí tuệ nhân tạo Jean-Gabriel Ganascia tin rằng "Những thứ như 'ý thức thông thường'... không bao giờ có thể tái sản xuất",[75][76] và nói rằng "Tôi không hiểu tại sao chúng ta lại nói về những sự sợ hãi. Ở phía ngược lại, điều này làm tăng hy vọng trong nhiều lĩnh vực như sức khỏe và thăm dò không gian."[74] Richard Sutton nói rằng "Tôi không nghĩ con người nên sợ hãi... nhưng tôi có nghĩ đến việc con người nên chú ý về điều đó."[77]
Cờ vây là một trò chơi phổ biến ở Hàn Quốc, Trung Quốc và Nhật Bản, và trận đấu này được theo dõi hoặc phân tích bởi hàng trăm triệu người trên toàn thế giới.[67] Nhiều kì thủ cờ vây hàng đầu mô tả đặc trưng của lối chơi không chính thống của AlphaGo là những nước đi có vẻ có vấn đề mà ban đầu làm mụ mẫm người theo dõi, nhưng có ý nghĩa trong nhận thức:[71] "Tất cả trừ những người chơi cờ vây giỏi nhất hình thành nên phong cách của mình bằng cách bắt chước những kì thủ giỏi nhất. AlphaGo có vẻ như có những nước đi hoàn toàn nguyên bản mà nó tự tạo ra."[67] AlphaGo dường như đã bất ngờ trở nên mạnh hơn rất nhiều, ngay cả khi so sánh với trận đấu tháng 10 năm 2015 của mình đối với Phiền Huy[78] nơi mà một máy tính đã lần đầu tiên đánh bại một kì thủ cờ vây chuyên nghiệp kể cả không có lợi thế chấp quân.[79]
Kì thủ số một Trung Quốc, Kha Khiết, người hiện tại cũng là kì thủ hàng đầu trên thế giới, ban đầu tuyên bố anh có khả năng đánh bại được AlphaGo, nhưng từ chối đối đầu với nó vì sợ rằng nó sẽ "sao chép phong cách của tôi".[80] Khi trận đấu diễn ra, Kha Khiết đi tới đi lui, nói rằng "rất có thể tôi (có thể) thua" sau khi đánh giá ba ván đấu đầu tiên,[81] nhưng lấy lại sự tự tin sau ván đấu thứ tư.[82]
Toby Manning, trọng tài trận đấu của AlphaGo trước Fan Hui, và Hajin Lee, tổng thư ký Liên đoàn cờ vây quốc tế, cả hai đều suy đoán rằng trong tương lai, người chơi cờ vây sẽ nhờ sự giúp sức từ máy tính để học được những gì mà họ đã thực hiện sai trong các ván đấu và cải thiện kĩ năng của họ.[79]
Lee đã xin lỗi vì thất bại của mình, và nói sau ván thứ ba rằng "Tôi đã đánh giá sai khả năng của AlphaGo và cảm thấy bất lực."[67] Anh nhấn mạnh rằng thất bại này là "thất bại của Lee Se-dol" và "không phải là một thất bại của nhân loại".[76][83] Lee cho biết sự thua cuộc cuối cùng của anh trước một cỗ máy là "không thể tránh khỏi" nhưng nói rằng "robot sẽ không bao giờ hiểu được vẻ đẹp của ván đấu theo cùng cách mà chúng ta, những con người, có thể hiểu được."[76] Lee gọi chiến thằng tại ván đấu thứ tư của mình là một "chiến thắng vô giá mà tôi (sẽ) không thể đánh đổi bằng bất kì thứ gì."[83]
Trong phản ứng đối với trận đấu, chính phủ Hàn Quốc công bố vào ngày 17 tháng 3 năm 2016 rằng họ sẽ đầu tư 863 triệu USD (1 nghìn tỷ won) vào nghiên cứu trí tuệ nhân tạo (AI) trong vòng năm năm tới.[84]
Bình luận chính thức trận đấu của Michael Redmond (9-dan) và Chris Garlock trên kênh YouTube của Google DeepMind: