特斯拉AI Day 2022:自动驾驶汽车与机器人的大脑解密

特斯拉AI Day 2022今日正式登场,想看热闹的人可能会有些失望,但对于希望看门道的内行人来说,这绝对是一场人工智能的知识盛宴。

特斯拉AI Day 2022如之前预告的,将焦点放在机器人Optimus和自动驾驶技术上,不过,这并不是一场“产品发布会”,而是一场“技术展示会”兼“征才大会”。

“这场大会的目标,就是希望吸引更多充满才华的人,加入特斯拉,跟我们一起创造新事物,改变世界。”特斯拉首席执行官马斯克从介绍机器人Optimus开始,展示特斯拉的人工智能技术。

Optimus练习在办公室替植物浇水。

Optimus人形机器人

特斯拉机器人Optimus相比之前知名的Boston Dynamic机器人,看起来笨拙而粗糙,但马斯克认为人形机器人有两个最重要的关键,被其他厂商忽略了:“制造成本”以及“可以与真实世界互动的大脑。”

“我们预期Optimus量产时的价格,大约是2万美元,比我们的车子还要便宜。”马斯克指出,Optimus有明确的生产目标,是要成为特斯拉工厂里的生产力,因此需要大规模量产同时也要控制成本,为了完成这个目标,他们导入了大量的造车经验,运用在机器人上。

许多人嘲笑特斯拉,只是把计算机装在四个轮子上就当做车子,特斯拉反过来引用这个笑话,“现在我们只是把计算机放在两只腿上。”

事实上,Optimus全身拥有28个关节驱动器,使全身能够产生200个以上不同角度的动作,最重要的手部,就拥有6个驱动器,可以做出27个角度,足以负重10公斤,并精准抓握小型零件。

在Optimus的腹部躯干,装有一个2.3 kWh的电池,足以提供它一整天工作所需电量,在电池旁边就是它的主要计算机,和特斯拉车辆相同的一块集成电路板,负责所有的运算,因此特斯拉可以将线路、散热系统全部集成在躯干上。

在Fremont工厂实习的Optimus原型机。

最重要的是,Optimus采用与特斯拉车辆相同的“导航系统”,具备Wi-Fi和LTE连接能力,可以即时侦测环境中的物体动向,让它前往目标,而不会撞上周边的物品和同事。

从技术展示看来,Optimus虽然已经在特斯拉加州费列蒙超级工厂测试,但是距离实际发挥作用,以及大规模量产还有很长一段路要走,也因此马斯克才更加渴求技术人才。

自动驾驶

在AI Day 2022中,特斯拉并未展示“更厉害”的自动驾驶功能,相反地,这是他们首度巨细弥遗的解释了自动驾驶软件系统的运行。如果对于人工智能技术没有兴趣的朋友,可以跳过这一段了。

从2021年特斯拉发布FSD Beta后,加入测试的车主从2千人,增加到目前的16万人,更惊人的是,在这一年之内,特斯拉自驾团队已经测试了7万5千个软件模型,并且发布了多达281个模块,更新了35个版本。

其中最重大的更新,就是上个月发布的Occupancy Network,工程师通过视频,而不是分格的图片,来训练计算机,成功创建出可以自动Label,自动时间标记,预测物体轨迹,计算出最佳路线的模块,而且运算时间只需要10毫秒。

此外,FSD beta的“车道模型”也跟以前大不相同,大部分的“车道模型”是根据道路上的标线而来,因此计算机通常在快速道路的表现会比较好。但FSD beta的车道,不仅是标线,而是依据现场环境,计算机自动搭建出的“合理行车路线”。

FSD车道模块。

这个模块在十字路口的作用最明显,FSD beta现在可以标示每个车道的起点、中间点和终点,即使路口不会有转弯标线,计算机也能掌握车辆合理的行车路线,搭配“动态预测”,计算机就能够完成高难度的开放路口左转。

重要的是,这样的运算系统,不仅运用在特斯拉车辆上,也会用在Optimus机器人上,来应对工厂或是住家内的动线。

Tesla FSDB视频数据处理架构。

听起来很简单,那为什么其他厂商多数还是用图片而不是视频来训练自驾系统呢?因为资料量太过庞大,特斯拉AI团队总监Ashok Elluswamy指出,即使特斯拉拥有三座Dojo超级计算机,还有1万4千颗GPU协助运算,但是他们每秒要处理40万部视频,视频暂存量多达30 PB,光是强大的运算还不够,而必须重新设计资料处理、运算模型和神经网络,才能做得到。

Tesla视频资料处理量。

团队也分享了一个FSD有趣的机制,在它的神经网络系统中,设置了一个“评分”系统,通过测试车主的视频,监督者会根据车主的行为给予评分,比如说未礼让行人、抢占车道等,此外计算机也会评估撞击造成的“成本”,考量这些因素之后,做出最佳选择。

计算机会计算众多变量后,选出分数最高的行为。

此外,FSDB也具备对抗“三宝”的智慧,当对向车辆违规左转时,虽然自己的车道是绿灯,计算机会评估车速之后,适当减速避免车祸。如果前面有车主在玩手机,停在路上发呆,特斯拉计算机也会自动绕开它,而不会傻傻的等在后面。

工程师主讲的AI Day

从开场的Optimus到自动驾驶,以及最后登场的Dojo超级计算机(篇幅有限,有兴趣了解Dojo细节的可以从视频最后半小时开始看) ,特斯拉AI Day 2022似乎刻意展现他们的组织扁平化,整场上台演讲的员工超过20位,包含了美国、欧洲、印度和华人非常多样,而且毫不客气的在技术细节不断深入,可以看到现场许多期待产品发布的媒体,都早早离席。

但这种Geek演讲模式,对于有心想要发展人工智能,或是资料处理的工程师来说,肯定比一堆营销辞藻堆积的促销大会有意思,这也正是特斯拉想要的,展现他们强大,并且尊重工程师的态度,吸引更多优秀人才加入。

(图片来源:Tesla)