NVIDIA披露MLPerf HPC 1.0性能测试成果,前5名NVIDIA占了4位

以NVIDIA A100 GPU为基础的超级计算机在最新的MLPerf HPC 1.0性能测试中,在排行前5名中占据4位,并分享通过软件升级提升性能的优势。

MLPerf是由产业共同组成的公正测试组织,其中MLPerf HPC测试项目的重点为通过AI加速强化超级计算机在天体力学、气候、分子动力学等模拟的能力,而这些耗费大量计算资源的模拟运算,也正迎来使用HPC高性能计算与AI协作加速的趋势。

MLPerf HPC 1.0通过Cosmoflow、Deepcam、Opencatalyst等3个典型的AI模型,分别通过训练与推论来评估超级计算机的性能表现,它们的工作负载分别为估算天文望远镜图像中物体的细节,侦测飓风和大气河流(Atmospheric Rivers)气候数据,以及预测化学物质分子之间作用力的程度。

每项测试可以分为2部分,其中强扩张(Strong Scaling)为衡量系统训练模型的速度,而弱扩张(Weak Scaling)则为衡量系统的吞吐量,验证在限定时间内可以完成多少模型的训练。

MLPerf HPC 1.0利用模拟天文望远镜、气候、分子动力学等3个典型的AI模型进行测试。

测试过程也分为将单一工作拆分为多个小块的强扩张,以及同时执行多个工作的弱扩张等2部分。

以A100 GPU为基础的超级计算机在最新的MLPerf HPC 1.0性能测试前5名中占据4位。

强扩张测试几乎是NVIDIA取得一面倒胜利。

弱扩张部分则由Fujitsu的富岳取得优势。

NVIDIA表示,与去年的MLPerf 0.7强扩张最佳成绩相比,现在NVIDIA能为Cosmoflow提升5倍性能,Deepcam甚至提升7倍,用户可以通过软件更新来提升AI运算的性能表现。