MLPerf基准测试结果公布,Nvidia称霸AI推理大赛

在今年稍早之际发布训练(Training)基准测试分数之后,MLPerf日前发布推理(Inference)基准测试的第一组得分结果。

与目前有5家公司所参加共63项MLPerf基准测试项目的训练回合相比,有更多的公司提交了结果。共有来自14个组织的500多个分数得到了验证。其中包括几家创业公司的数字,然而一些知名的创业公司显然没有参加。

在支持可让系统直接对决之严格条件的封闭专区(Closed Division),结果显示性能上有5个数量级的差异,并且在预估功耗方面跨越了3个数量级。在开放专区(Open Division),厂商的提交可以使用一系列的模型,包括低精准度的实例。

Nvidia宣称取得封闭专区所有商用组件类别的第一名。在数据中心类别的其他领导厂商包括Habana Labs、Google和英特尔(Intel),而Nvidia则在边缘类别中与Intel及高通(Qualcomm)一较高下。

“Nvidia是唯一一家拥有量产晶体硅、软件、可程序性及人才,同时发布所有类型MLPerf基准测试成绩,并赢得几乎所有测试类别的公司,”市场研究公司Moor Insights and Strategy分析师Karl Freund指出:“GPU的可程序性为将来的MLPerf版本提供了独特的定位……我认为这在在展露了Nvidia实力的广度,以及挑战者的利基本质。但随着时间的推移,许多竞争对手将逐渐成熟,因此Nvidia需要在硬件和软件方面持续创新。”

Nvidia公布显示测试结果判定的图表,针对商用组件的所有4个封闭专区测试场景皆名列第一。

这些场景代表不同的使用案例。例如针对数据中心推理的脱机和服务器场景。脱机场景表示要对大量照片进行脱机照片标记作业,并测量纯数据传输总量。服务器场景表示来自不同用户的多个请求,在不可预测的时间提交请求,并在固定时间内测量数据传输总量的使用案例。边缘场景包括单一串流与多串流,前者会对象是行动手机App的单一图片进行推理计时,后者则会测量多摄影机系统中有多少串流图片能被同步推论。

参赛公司可以提交所选机器学习模型的结果,这些模型在四个场景分别执行图像分类、对象检测和语言转译。

Nvidia在服务器和脱机类别所有5个基准测试拿下第一

“从数据中心的结果来看,Nvidia在服务器和脱机类别的所有5个基准测试中皆拔得头筹,”Nvidia加速运算产品管理总监Paresh Kharya表示:“我们的图灵GPU在商用解决方案方面远胜其他公司。”

Kharya特别强调了一个事实,也即Nvidia是唯一一家提交数据中心类别中所有5个基准测试模型结果的公司,而在服务器类别(这是更困难的场景)中,Nvidia的性能表现皆高出竞争对手甚多。

数据中心领域最接近Nvidia表现的竞争对手是以色列创业公司Habana Labs,拥有Goya推理芯片。

“Habana是唯一一个全面投产高性能晶体硅的挑战者,有望支持功耗数据的下一版本MLPerf组件应该会有更好表现。”分析师Karl Freund表示。

Habana Labs指出,基准测试分数纯粹基于性能,功耗并非测量标的,不包含实用性(比如考虑某个解决方案是采无风扇冷却还是水冷式设计),也不包含成本。

Habana并通过开放专区来展现低延迟能力,延迟的限制比封闭专区更严格,并提交多串流场景的结果。

在边缘基准测试,Nvidia拿下商用解决方案之封闭专区所有四个类别的冠军头衔。高通Snapdragon 855系统单芯片与Intel Xeon CPU则在单一串流类别紧跟其后,然而高通和Intel都没有提交更困难的多串流场景测试结果。

另外MLPerf发布许多“预览版”系统(即未正式上市的系统)测试结果,包括专门针对Intel’s Nervana NNP-I的阿里巴巴旗下“平头哥”公司“含光”(Hanguang)芯片、以色列创业公司Halio的Hailo-8,以及Centaur Technologies的参考设计。与此同时,研发类的主要参赛厂商是一家鲜为人知的韩国创业公司Furiosa AI。

(首图来源:Nvidia)