AlphaGo Zero

Deepmind的新版程序

条目

历史版本

AlphaGoZero是谷歌下属公司Deepmind的新版程序。

从空白状态学起，在无任何人类输入的条件下，AlphaGoZero能够迅速自学围棋，并以100:0的战绩击败“前辈”。

发展沿革

2017年10月19日凌晨，在国际学术期刊《自然》（Nature）上发表的一篇研究论文中，谷歌下属公司Deepmind报告新版程序AlphaGoZero：从空白状态学起，在无任何人类输入的条件下，它能够迅速自学围棋，并以100:0的战绩击败“前辈”。Deepmind的论文一发表，TPU的销量就可能要大增了。其100:0战绩有“造”真嫌疑。它经过3天的训练便以100：0的战绩击败了他的哥哥AlphoGoLee，经过40天的训练便击败了它的另一个哥哥AlphoGoMaster^[1]

AlphaGo Zero

发展沿革

工作原理