DeepMind发布可改进机器人堆栈物体能力的基准测试RGB-Stacking

Google旗下的人工智能研究组织DeepMind，发布了最新的机器人物体堆栈任务RGB-Stacking，其提供基于计算机视觉技术的机器人一个测试基准，在这个基准测试中，机器人需要学习抓住不同物体，并且使物体保持平衡地堆栈在一起。DeepMind希望借由这个基准测试，促进机器人的研究，增进机器人操作物体的能力。

研究人员提到，与之前的研究不同之处在于，RGB-Stacking使用更多样的物体，并且经过大量实验来验证他们的发现，而他们的结果也显示，模拟和现实世界资料的组合，有助于机器人学习复杂的多物体操作，并且泛化解决新物体问题。

在RGB-Stacking基准测试中，有一个放着红色、绿色和蓝色物体的篮子，篮子的上方有一个搭载夹具的机械手臂，而RGB-Stacking的任务，是要机器人在20秒内，将红色物体堆栈到蓝色物体的上方，而绿色物体则是充当障碍物，混淆机器人的判断，借由多变化的堆栈和抓握方式，迫使机器人必需要表现出更复杂的拾取和放置行为。

RGB-Stacking基准测试拥有两个不同难度的任务，目标分别为技能掌握以及技能泛化，技能掌握的目标是要让机器人能够熟练的堆栈物体，而技能泛化则是要让机器人，具有堆栈未曾见过物体的能力。

RGB-Stacking的目标是要以增强学习，训练机器手臂来堆栈不同形状的物体，研究人员借助模拟器得以快速训练，并且借由一步策略来改进机器人在真实世界的操作。在技能掌握上，DeepMind的机器人在模拟世界拥有79%的成功率，在真实机器人上实现了68%的成功率；而经使用真实资料改进的一步策略，达到了82%；而技能泛化，在真实机器人上获得54%的成功率。

研究人员提到，近年来学习算法已经大规模解决困难的机器人操作问题，但这些研究重点，集中在抓取、推动和其他形式的单物体操作任务，而RGB-Stacking则是要让机器人掌握复杂的多物体堆栈技巧。不过，缩短技能掌握和技能泛化的差距，仍然是一大挑战。

研究人员开源了RGB-Stacking相关的研究资源，希望有助于其他人员的研究，包括模拟环境，以及用来构建真实机器人的RGB-Stacking环境设计，还有能够3D打印出RGB物体模型的信息，同时广泛地开源机器人研究中一系列函数库和工具。