MIT用“群”训练, AI只练了300次就学会玩叠叠乐!

AI已经能做很多事情,例如下围棋、打牌、打星际争霸,而且表现比人类好。现在, AI 又多了一项新技能:玩叠叠乐。

叠叠乐 AI 机器人,学会判断“触觉”

麻省理工学院(MIT)的科学家研发一款叠叠乐 AI 机器人。这款机器人有摄影机和力量传感器,可以感知叠叠乐的平衡状态,并有两根“手指”,用于推、抽、抓取,以及放置积木。

不同于围棋和星际争霸等纯粹智能的游戏,叠叠乐还包含了“触觉”的判断,玩家需要感知抽积木时的叠叠乐平衡状态,才能够抽出正确的积木,放到正确的位置,避免叠叠乐倒塌。因此对 AI 来说,具备玩叠叠乐的能力,等于具备触觉感知、物理模型构建,以及精细操作的能力,这些是 AlphaGo 等 AI 所没有的技能。

用“群”的概念,提升AI 学习效率

不同于传统用大量数据训练AI 的方式,科学家用“群(cluster)”的方式,让机器人大约玩了300 次,就学会了叠叠乐。机器人将类似的传感结果和叠叠乐的平衡状态分组,例如将不好移动的积木的传感数据分为一组,将容易移动的积木的传感数据分为一组,将叠叠乐倒塌前的行为数据分为一组,机器人就借由这些分组数据开发模型,预测每个动作之下,叠叠乐会如何被影响。

该研究的主导者 Nima Fazeli 表示,这种训练 AI 的方式是模仿人类的学习方式,它能提升 AI 的学习效率。人类学习玩叠叠乐时,会分辨好推和不好推的积木,而不是将所有的积木一视同仁,全部都“推推看”,这就是分群的概念,比试推全部的积木还要省时间。

虽然从视频上来看,机器人的表现和人类相当,但是机器人没有情绪压力,手不会抖,或许当叠叠乐叠到了“危险”的程度,机器人的表现就会超越人类玩家。

科学家表示,这款机器人的传感技术,可以应用在工业生产上,特别是那种需要精确传感的生产流程,例如手机组装。或许几年之后,这种 AI 不只是用来玩乐高,还可以用来盖真的摩天大楼。