DeepMind发布可改进机器人堆栈物体能力的基准测试RGB-Stacking

Google旗下的人工智能研究组织DeepMind,发布了最新的机器人物体堆栈任务RGB-Stacking,其提供基于计算机视觉技术的机器人一个测试基准,在这个基准测试中,机器人需要学习抓住不同物体,并且使物体保持平衡地堆栈在一起。DeepMind希望借由这个基准测试,促进机器人的研究,增进机器人操作物体的能力。

研究人员提到,与之前的研究不同之处在于,RGB-Stacking使用更多样的物体,并且经过大量实验来验证他们的发现,而他们的结果也显示,模拟和现实世界资料的组合,有助于机器人学习复杂的多物体操作,并且泛化解决新物体问题。

在RGB-Stacking基准测试中,有一个放着红色、绿色和蓝色物体的篮子,篮子的上方有一个搭载夹具的机械手臂,而RGB-Stacking的任务,是要机器人在20秒内,将红色物体堆栈到蓝色物体的上方,而绿色物体则是充当障碍物,混淆机器人的判断,借由多变化的堆栈和抓握方式,迫使机器人必需要表现出更复杂的拾取和放置行为。

 

RGB-Stacking基准测试拥有两个不同难度的任务,目标分别为技能掌握以及技能泛化,技能掌握的目标是要让机器人能够熟练的堆栈物体,而技能泛化则是要让机器人,具有堆栈未曾见过物体的能力。

RGB-Stacking的目标是要以增强学习,训练机器手臂来堆栈不同形状的物体,研究人员借助模拟器得以快速训练,并且借由一步策略来改进机器人在真实世界的操作。在技能掌握上,DeepMind的机器人在模拟世界拥有79%的成功率,在真实机器人上实现了68%的成功率;而经使用真实资料改进的一步策略,达到了82%;而技能泛化,在真实机器人上获得54%的成功率。

研究人员提到,近年来学习算法已经大规模解决困难的机器人操作问题,但这些研究重点,集中在抓取、推动和其他形式的单物体操作任务,而RGB-Stacking则是要让机器人掌握复杂的多物体堆栈技巧。不过,缩短技能掌握和技能泛化的差距,仍然是一大挑战。

研究人员开源了RGB-Stacking相关的研究资源,希望有助于其他人员的研究,包括模拟环境,以及用来构建真实机器人的RGB-Stacking环境设计,还有能够3D打印出RGB物体模型的信息,同时广泛地开源机器人研究中一系列函数库和工具。