在现实世界拓展机器学习应用的三种方法

称为NeurIPS(神经信息处理系统会议)的全球人工智能领域盛会刚刚结束,出席者人数创下历史新高,即使采取抽票制也难以容纳。9,000张门票在12分钟内售完,显示了世界各地对AI兴趣的爆炸性增长。

然而,尽管AI创新走出学术界,开始在产业界出现,大多数公司在落实AI解决方案时仍然面临困难。在NeurIPS向AI世界发出警钟的同时,机器人产业似乎对机器学习(ML)解决方案落地有更务实的考量。

我任职的公司提供机器学习软件,使工厂和仓库中有更多具自主性和更灵巧的机器人。为了弥补技术和产品落地中间的差距,我们和机器人公司与系统集成商密切合作,将最前端的机器学习研究产品化。

日前我飞到东京,参加全球最大规模的机器人展会“国际机器人展览会”(IREX);在这里,领先的机器人公司展示了将AI以及ML应用在机器人领域的各种方法。

从“自动化”到真正“自主化”,AI造就的机器人技术领域,最大成果是从原先的“自动化”(工程师借由程序设计编写规则,让机器人遵守)迈向了真正的“自主学习”。

在先前的文章中,我谈到AI如何造就新一代机器人2.0时代。传统机器人主要用于大规模生产线,工程师事先编写程序,让机器以高精度、高速度执行相同的任务,但机器本身无法对变化或意外做出反应,因此弹性有所不足。

然而,随着消费者对定制化产品需求的增长、和劳动力的不断萎缩,我们需要更加自主和灵活的机器人。

也因此,有公司开始尝试将ML应用于机器人领域,使新一代的机器人能够处理传统机器人无法完成的供作。在IREX中,我们看到了ML用于改善机器人的视觉、控制、以及提高真实使用案例的扩张性。

机器视觉:在识别、可扩展性和自主学习方面的突破

即使是最先进的3D结构化光相机也难以识别具有透明封装、反射或深色表面的物体,因为光线会散射或被吸收。

由于物品相互重叠,杂乱堆放的场景带来了更多的挑战。这就是为什么大多数制造商都使用振动台,或零件进料器来分散物品的原因。

此外,传统的机器视觉系统不够灵活:你需要通过事先上传每样物品的3D模型来登录对象,以便后续进行图片及对象本身的匹配。只要过程中有任何一个小变化,都必须重新登录对象、或是修改程序设计。

但是现在,随着在深度学习、语义分割和场景理解等领域的进步,我们逐渐可以用一般相机来识别透明的、或是会反光的包装。

在FANUC的展位上,“LR Mate 200iD”拾箱机器人利用深度学习算法、以及3D视觉传感器,来示范拾取随机放置在一个箱子里的相同的金属零件。FANUC表示,由于他们的系统可以即时执行3D图像及对象比对,所以不需要预先登录。

在FANUC展台旁边的川崎重工(KHI),则利用来自Photoneo和Ascent两家创业公司的ML技术,展示了类似的随机对象拣选方案;在另外一边,KHI则与Dexterity公司合作,展示了机器人可以同时处理、搬运各种尺寸盒子的自动处理存货解决方案。

在另一个展览大厅,日本机器手臂大厂DensoWave以及旧金山的ML创业公司OSARO首次展示了“对象方向识别”(Orientation)功能,让机器人可以从杂乱的箱子里取出透明瓶子;不仅能够识别最佳拾取点,而且还能识别物体方向、并将瓶口朝上放上输送带。

DensoWave机器人业务部总经理Yosuke Sawada评论:“OSARO新开发的“定向”功能是客户一直在等待的技术之一。该令人兴奋的新功能,有助于识别对机器人较为困难(例如透明)的物品,并提高操作员和工厂自动系统的拣选率。”

在这项展示中,使用的瓶子是完全透明的,因此很难用传统的机器视觉传感器识别;而且,过去还没有其他公司展示过类似的功能。

这项让技术机器手臂不仅可用于简单的拾取和放置,还可用于更复杂的零件装备(kitting)、包装(packaging)、机器装载(machine loading)、以及装配(assembly)等工作。

机器控制:智能放置和品项处理

作为人类,我们从出生起就不断练习捡拾和放置各种物品,因此可以不假思索就本能地完成这些工作。但是机器没有这种经验,必须重新学习这些任务。

尤其是在对产品包装特别要求的日本市场,各项商品都需要被精心包装,确保对象和外包装的完整性,没有任何缺损。

利用ML,机器现在可以更准确地判断深度。ML模型还可以通过训练学习,自动判定物体的方向和形状,例如杯子是朝上或向下,或处于其他状态。

对象建模或体素化可用于预测和重建3D对象。它们使机器能够更准确地预测实际物品的大小和形状,从而将物料放置在所需位置。

这些技术使机器能更准确预测实际物品的大小和形状,从而将物料放置在所需位置;因此,也让以产品品项(SKU)为基础的处理方式得以实现:机器人可以根据物品的脆弱或易碎程度,选择将物品轻轻放下、或是快速放置。

因此,我们可以借由自动改变处理方式,让系统处理量优化,而又不会损坏任何物品。

在展会中,也有些公司也开始在运动规划中,尝试使用强化学习或机器学习技术。例如日本创业公司Acsent展示了一段利用“强化学习”来组合两个部件的视频;而机器手臂大厂“安川”(Yaskawa)也谈到了在路径规划中使用机器学习的潜在好处。

但是,如果上述的机器学习改进,需要大量数据和长时间的训练,就会造成在实际执行上的困难。在机器人和自动驾驶汽车等实际应用中,获取训练数据既有难度、成本也相当昂贵;这就是为什么我对于IREX中提及的数据效率(data efficiency)问题特别关注。

适用于现实世界的可扩展性:数据效率

Yaskawa去年为开发工业机器人AI解决方案而成立的新公司“AI Cube Inc.”(AI3),在IREX的发布会中推出了为企业将机器学习模型数字化的工具“Alliom”。

根据AI Cube的说法,Alliom提供了一个模拟环境(simulation),用于进行数据扩展(data augmentation)、并生成类似真实对象的合成数据(synthetic data)。

Yaskawa利用Alliom加快了ML模型随机拣料的训练过程,并希望在不久的将来,能将该解决方案扩展到各种其他应用之中。

这也表示,机器人产业已经超越了仅能引人注目的ML算法,而开始考虑实际应用支持ML的机器人。ML解决方案不仅需要能够成功运行,还必须能有效跨越各种使用场景、扩展用途,否则客户很难有足够诱因来引进这类系统。

结语

在上一篇文章中,我提到机器人公司正面临“创新困境”:他们意识到创新的迫切需要,但仍然需要照顾他们的核心客层,也就是需要高速度、高精度工作能力的汽车业和制造业公司;然而,相对于其他市场对灵活性要求较高、也需要机器人能自主学习识别和处理各种组件,这一点是互相矛盾的。

在IREX,我们看到机器人巨头与KHI与Photoneo、Dexterity、Ascent、DensoWave与OSARO、FANUC、以及Preferred Networks等创业公司联合展出,显示机器人公司正在改变并拥抱AI创新。但是,这样的改变速度够快吗?

在汽车业,我们看到汽车OEM制造商在迈向自动驾驶的过渡中,与特斯拉和Waymo等新进者展开竞争;然而到目前为止,我们还没有看到科技巨头进入机器人产业。

但Google、DeepMind、Facebook都已经在机器人相关的ML方面,投入了可观的研究团队,真正进入机器人产业可能也只是时间上的问题。

未来几年之中,观察AI将如何颠覆机器人行业、重新洗牌,将会是很有趣的事情。科技巨头、机器人制造商、电子汽车制造商、AI创业公司,谁将胜出?

最后,谁又能巩固在AI定义机器人时代的领导地位?