MIT用“群”训练， AI只练了300次就学会玩叠叠乐！

AI已经能做很多事情，例如下围棋、打牌、打星际争霸，而且表现比人类好。现在， AI 又多了一项新技能：玩叠叠乐。

叠叠乐 AI 机器人，学会判断“触觉”

麻省理工学院（MIT）的科学家研发一款叠叠乐 AI 机器人。这款机器人有摄影机和力量传感器，可以感知叠叠乐的平衡状态，并有两根“手指”，用于推、抽、抓取，以及放置积木。

不同于围棋和星际争霸等纯粹智能的游戏，叠叠乐还包含了“触觉”的判断，玩家需要感知抽积木时的叠叠乐平衡状态，才能够抽出正确的积木，放到正确的位置，避免叠叠乐倒塌。因此对 AI 来说，具备玩叠叠乐的能力，等于具备触觉感知、物理模型构建，以及精细操作的能力，这些是 AlphaGo 等 AI 所没有的技能。

用“群”的概念，提升AI 学习效率

不同于传统用大量数据训练AI 的方式，科学家用“群（cluster）”的方式，让机器人大约玩了300 次，就学会了叠叠乐。机器人将类似的传感结果和叠叠乐的平衡状态分组，例如将不好移动的积木的传感数据分为一组，将容易移动的积木的传感数据分为一组，将叠叠乐倒塌前的行为数据分为一组，机器人就借由这些分组数据开发模型，预测每个动作之下，叠叠乐会如何被影响。

该研究的主导者 Nima Fazeli 表示，这种训练 AI 的方式是模仿人类的学习方式，它能提升 AI 的学习效率。人类学习玩叠叠乐时，会分辨好推和不好推的积木，而不是将所有的积木一视同仁，全部都“推推看”，这就是分群的概念，比试推全部的积木还要省时间。

虽然从视频上来看，机器人的表现和人类相当，但是机器人没有情绪压力，手不会抖，或许当叠叠乐叠到了“危险”的程度，机器人的表现就会超越人类玩家。

科学家表示，这款机器人的传感技术，可以应用在工业生产上，特别是那种需要精确传感的生产流程，例如手机组装。或许几年之后，这种 AI 不只是用来玩乐高，还可以用来盖真的摩天大楼。