AlphaZero

«AlphaZero» (па-беларуску: АльфаЗыраў) — кампутарная праграма распрацоўкі кампаніі «DeepMind» (ва ўласнасьці Google), наступнік альгарытму «AlphaGo Zero». У адрозьненьне ад апошняй, распрацаваная з магчымасьцю гульні ня толькі ў го, але таксама ў шахі й сёгі.

5 сьнежня 2017 року «DeepMind» выпусьціў праграму «AlphaZero», якая на працягу наступных 24 гадзінаў прааналізавала правілы ўсіх трох гульняў і перамагла ўсе кампутарныя праграмы-чэмпіёны: Stockfish (шахі), elmo (сёгі) і 3-хдзённую вэрсію праграмы AlphaGo Zero (го). Дзеля трэніроўкі «AlphaZero» карысталася «саманавучаньнем» з дапамогай 5000 TPU першага пакаленьня і навучаньнем нэўронных сетак з дапамогай 64-х TPU другога пакаленьня, пры гэтым ня маючы доступу да дэбютных ці эндшпільных кнігаў.

Матч паміж «AlphaZero» і «Stockfish 8» са 100 гульняў (па хвіліне на ход) скончыўся на карысьць першай з вынікам 28 перамогаў, 0 паразаў і 72 нічыі. У адрозьненьне ад «Stockfish» і «elmo», якія за сэкунду знаходзяць 70 мільёнаў і 35 мільёнаў пазыцыяў адпаведна, «AlphaZero» шукае ўсяго 80 000 пазыцыяў, кампэнсуючы гэта глыбінёй нэўроннай сеткі, каб абраць найбольш аптымальныя варыянты. У пачатку 2018 року «AlphaZero» і «Stockfish 8» правялі яшчэ адну сэрыю з 1000 партыяў зь іншым кантролем часу — 3 гадзіны на партыю + 15 сэкундаў пасьля кожнага ходу. «AlphaZero» перамог з вынікам +155 −6 =839[1].

У матчы ў сёгі супраць «elmo» «AlphaZero» перамог у 90 партыях са ста, прайграў 8 разоў і двойчы згуляў унічыю. У гульні з «AlphaGo Zero» у го «AlphaZero» перамог у 60 партыях і прайграў у 40.

  1. ^ pete. (6 сьнежня 2018) AlphaZero Crushes Stockfish In New 1,000-Game Match Chess.com Праверана 21 сьнежня 2018 г.

Вонкавыя спасылкі

[рэдагаваць | рэдагаваць крыніцу]