NVIDIA公布H100 GPU MLPerf性能成绩，最高较前代A100提升6.7倍

NVIDIA公布最新MLPerf性能成绩，除了新款H100 GPU具有亮眼表现之外，现有的A100也通过软件优化而有所进步。

MLPerf是产业用于衡量AI性能的测试基准，包括Amazon、Arm、Baidu、Google、Intel、Meta、Microsoft，以及哈佛大学、斯坦福大学、多伦多大学在内的众多企业与学术单位皆支持这项标准。

在最新公布的MLPerf性能成绩中，采用Hopper架构的H100 GPU在所有企业作业负载的8项测试中皆创下训练模型的世界记录，其中表现最好的BERT项目成绩较前代A100 GPU高出6.7倍

在独立的MLPerf HPC基准测试之超级计算机科学作业负载中，A100 GPU在AI训练模型所有测试项目都拔得头筹。而A100 GPU也通过不断改善的软件堆栈，在CosmoFlow测试训练AI模型的成绩较2年前首次MLPerf HPC测试的最佳结果还要高出9倍。在同样的作业负载中，每个A100芯片性能也比其他产品高出66倍之谱。

H100 GPU的MLPerf性能成绩前代A100最多提升6.7倍，A100也通过软件优化提升2.5倍。

这次公开最新的测试成绩为MLPerf训练v2.1与MLPerf HPC v2.0。

MLPerf训练v2.1具有多种图片分类、物品侦测、医学图片、语音识别、自然语言处理、推荐、增强学习等项目，而MLPerf HPC v2.0则有天体物理学、天气预测及分子动力学等项目。

从测试图表可以看到H100与A100的进步。图中1X的基准线为A100初次提交的成绩。

A100 SuperPOD的性能远优于Intel的Gaudi2、Sapphire Rapids等处理器。（图表单位为训练使用时间，越短越好，打叉为没有提交成绩）

H100在BERT测试项目中的表现比Gaudi2高出2.4倍，比Sapphire Rapids高出27倍。

NVIDIA表示受益于Transformer引擎，让Hopper架构GPU在训练用于自然语言处理的热门BERT模型时有极为出色的表现，H100 GPU业在初登场打破MLPerf推论基准测试记录的2个月后，又在产业组织的AI训练最新测试中，创下处理企业AI作业负载的全新世界记录。这些测试结果显示，对于创建与部署最先进AI模型以要求最高表现的用户来说，H100是最佳选择。