NVIDIA公布H100 GPU MLPerf性能成绩,最高较前代A100提升6.7倍

NVIDIA公布最新MLPerf性能成绩,除了新款H100 GPU具有亮眼表现之外,现有的A100也通过软件优化而有所进步。

MLPerf是产业用于衡量AI性能的测试基准,包括Amazon、Arm、Baidu、Google、Intel、Meta、Microsoft,以及哈佛大学、斯坦福大学、多伦多大学在内的众多企业与学术单位皆支持这项标准。

在最新公布的MLPerf性能成绩中,采用Hopper架构的H100 GPU在所有企业作业负载的8项测试中皆创下训练模型的世界记录,其中表现最好的BERT项目成绩较前代A100 GPU高出6.7倍

在独立的MLPerf HPC基准测试之超级计算机科学作业负载中,A100 GPU在AI训练模型所有测试项目都拔得头筹。而A100 GPU也通过不断改善的软件堆栈,在CosmoFlow测试训练AI模型的成绩较2年前首次MLPerf HPC测试的最佳结果还要高出9倍。在同样的作业负载中,每个A100芯片性能也比其他产品高出66倍之谱。

H100 GPU的MLPerf性能成绩前代A100最多提升6.7倍,A100也通过软件优化提升2.5倍。

这次公开最新的测试成绩为MLPerf训练v2.1与MLPerf HPC v2.0。

MLPerf训练v2.1具有多种图片分类、物品侦测、医学图片、语音识别、自然语言处理、推荐、增强学习等项目,而MLPerf HPC v2.0则有天体物理学、天气预测及分子动力学等项目。

从测试图表可以看到H100与A100的进步。图中1X的基准线为A100初次提交的成绩。

A100 SuperPOD的性能远优于Intel的Gaudi2、Sapphire Rapids等处理器。(图表单位为训练使用时间,越短越好,打叉为没有提交成绩)

H100在BERT测试项目中的表现比Gaudi2高出2.4倍,比Sapphire Rapids高出27倍。

NVIDIA表示受益于Transformer引擎,让Hopper架构GPU在训练用于自然语言处理的热门BERT模型时有极为出色的表现,H100 GPU业在初登场打破MLPerf推论基准测试记录的2个月后,又在产业组织的AI训练最新测试中,创下处理企业AI作业负载的全新世界记录。这些测试结果显示,对于创建与部署最先进AI模型以要求最高表现的用户来说,H100是最佳选择。