AlphaGo Zero

Deepmind的新版程序
AlphaGoZero是谷歌下属公司Deepmind的新版程序。
从空白状态学起,在无任何人类输入的条件下,AlphaGoZero能够迅速自学围棋,并以100:0的战绩击败“前辈”。

发展沿革

2017年10月19日凌晨,在国际学术期刊《自然》(Nature)上发表的一篇研究论文中,谷歌下属公司Deepmind报告新版程序AlphaGoZero:从空白状态学起,在无任何人类输入的条件下,它能够迅速自学围棋,并以100:0的战绩击败“前辈”。Deepmind的论文一发表,TPU的销量就可能要大增了。其100:0战绩有“造”真嫌疑。它经过3天的训练便以100:0的战绩击败了他的哥哥AlphoGoLee,经过40天的训练便击败了它的另一个哥哥AlphoGoMaster[1]

工作原理