脸书开源经2,000万场自我对战训练的ELF OpenGo模型

脸书去年开源了能完败职业围棋高手的人工智能ELF OpenGo,现在更进一步开源经两千万次自我对战的模型与数据集等相关研究成果。 ELF OpenGo的前身原为DeepMind开发的围棋软件AlphaGo Zero,脸书将其重新实例发布ELF OpenGo,能以一颗GPU就打赢排名前30的4位围棋高手,还是皆以20比0完胜。

ELF是脸书在2017年发布的游戏研究平台,讲究可扩展、轻量与灵活的特性,ELF让研究人员能在各种游戏环境中测试算法,包括棋盘、街机与即时战略游戏,而在2018年,脸书开源了基于ELF平台的OpenGo。现在脸书进一步发布ELF OpenGo相关的新功能和研究成果,开源经过2千万次人工智能自我对战训练的模型。

脸书提到,由于训练模型需要有大量的计算资源,因此即便他们在2018年发布ELF OpenGo到源码,但多数研究人员仍无法重现脸书的研究成果。所以脸书决定从头训练开始训练ELF OpenGo,并发布其所有的研究成果,对外公开人工智能能够打败玩家的原因,同时也详述了技术的局限,脸书特别举例,人工智能在学习招式的速度比人类慢得多,像是下图的梯子招式,人工智能就花了很多时间才学到。

脸书开源的ELF OpenGo是目前最新的模型以及最佳程序代码版本,包括2千万次自我对战的模型以及1,500个中介模型数据。脸书还以模型分析职业围棋棋士的赛局,发现模型的预测能力,约在总训练时间的10%就已经达到稳定水准,并随着训练的时间增加,ELF OpenGo的技能强度随之提升。

这个最新版本的ELF OpenGo,能以60%以上的胜率打赢ELF OpenGo雏形。脸书表示,即使是ELF OpenGo雏形,其围棋能力也早就超越人类,脸书以模型证明,即便是最优秀的围棋棋士,下的棋步也不一定是最高超的。

这次开源的内容,还包括超过300年的8.7万场专业围棋历史对战数据,该数据集收集了跨越1700年到2018年的围棋赛局,脸书的系统通过机器人和人类之间的棋步预测,评估了这些历史赛局棋步的水准。脸书同时发布工具,让用户能深入每一场围棋对战的细节,研究特定比赛特定棋士的棋步。该交互工具提供可视化功能,方便用户能更轻易地审查历史数据存挡

脸书提到,对于人工智能的研究人员来说,ELF OpenGo是丰富的研究资源,而对于围棋的爱好者而言,其专业的赛局分析能力,可以成为新型训练辅助工具,就是有一位超强棋艺大师能与玩家对战练习。脸书发布了Windows版本应用程序,可以让玩家下载使用。

不过,研究还没结束,脸书表示,即便ELF OpenGo能够打赢人类,也是因为进行了数百万场对战以后的结果,但显然人类的学习更有效率,脸书接下来的目标,就是让人工智能学习的效率提升。