30. 29
Alpha Go Zero のゼロからの学習
・2017/10
人間の知識を使わずに
囲碁をゼロから学習
Mastering the game of Go without human
knowledge (Silver et al., 2017)
31. 30
Alpha Zero の登場
・2017/12 AlphaGo Zero のアルゴリズムを汎用的に適用した
AlphaZero
・チェス、将棋、囲碁 にて最高クラスのプログラムを超えた
(2017春コンピュータ将棋選手権優勝のelmoに 勝率 9割)
Mastering Chess and Shogi by Self-Play
with a General Reinforcement Learning
Algorithm (Silver et al., 2017b)