Nvidia年度GTC大会一连发布新架构GPU、CPU产品及AI超级计算机

在2022 GTC技术大会上，Nvidia首席执行官黄仁勋在主题演讲中，一连发布采用新架构的GPU、CPU产品及其超级计算机系统，另外针对3D设计协作与模拟平台Omniverse，在今年也有重要发布，推出专用模拟运算服务器，以及云计算服务。

一开场没多久，黄仁勋就介绍新一代GPU产品Nvidia H100出场，新GPU不论制程和架构都翻新，采用全新Hopper架构设计，搭配先进4纳米制程，其内置晶体管数量高达800亿个。根据该公司数据，在浮点运算性能上，采用新架构的H100，较前一代Ampere架构A 100性能获得显著提升，在FP8精度浮点运算次数提高6倍，达到4 petaFLOPS，另外在半精度（FP16）则有来到每秒2 petaFLOPS的提升。

Nvidia强调，新GPU适合用于加速Transformer模型训练，因为在Hopper架构中，内置Transformer引擎，包括一个新的Tensor core和使用FP8和FP16精度格式的软件，以及搭配动态处理层的Transformer网络，来优化Transformer模型训练。

这款新GPU也是第一款支持机密运算的GPU产品，改以云计算实例来提供时，每个Hopper GPU内多个实例，都可以使用机密运算，来创建一个值得信赖的云计算环境，保护硬件内资料和应用。该款GPU也是第一款同时支持PCIe 5.0及HBM3高带宽内存的GPU产品。单一颗H100处理器可以提供每秒40Tb的I/O带宽。

Nvidia还推出采用新GPU的新一代AI超级计算机系统DGX H100，使用8个H100 GPU组成，性能可达到32 petaFLOPS以及拥有24 TB/s的内存带宽和640GB的HBM3高带宽内存。

如果搭配新一代NVLink交换机系统，最多可以连接32台DGX（合计256颗H100 GPU），创建H100 DGX POD集群，性能可达到1 exaFLOPS。

Nvidia还推出使用18个DGX POD（一共576台DGX，合计4,608个H100 GPU）打造的Nvidia EOS超级计算机系统，宣称在AI应用上，可以提供18.4 exaFLOPS的处理性能，比当今速度最快的日本富岳超级计算机还快4倍。

除了GPU产品，在CPU产品方面也有更多布局，除了首款Grace CPU产品将在明年正式出货，该公司推出Grace Hopper超级芯片，集成了Hopper架构GPU与Grace CPU并通过NVLink C2C互联，传输速度可达900 GB/s。除此之外，还有一款双Grace CPU芯片组的超级芯片在这次大会中发布，可以提供最多144个核心，拥有396MB缓存，支持LPDDR5X ECC内存，带宽高达1TB/s。

Nvidia表示，Grace CPU也能使用各种Nvidia软件平台，包括Nvidia RTX、HPC、Nvidia AI以及Omnverse等。

除了更新GPU、CPU产品，Nvidia这次更新超过60个SDK，提供更多功能和应用加速。例如这次推出名为Sionna的新SDK，可提供6G通信研究的AI框架，另外物理机器学习模型框架Modulus以及开源医疗图片处理的AI框架Monai，也都重新优化。

这几年，Nvidia力推的3D设计协作与模拟平台Omniverse，在今年GTC大会中也有重要更新。从Omniverse发展来看，在去年元宇宙掀起的热潮下，也让Omniverse发展迅速，Omniverse生态系统也逐渐壮大，从去年8家，到今年增长到82家，包括Adobe、Epic、Bentley等软件都可以支持Omniverse，目前已有10.6万名用户，和累计超过15万次下载。

Nvidia还介绍了一款Omniverse专用的OVX服务器，可供企业打造自己的数字分身应用，这款服务器是由8个A40 RTX GPU、2个Intel Ice Lake CPU和3个CX6 NIC组成，内置1TB系统内存，和16TB NVMe存储，另外同样可以SuperPOD来扩展，最多可以使用32台OVX创建运算集群。目前OVX服务器正式推出。

除了提供本地部署的Omniverse硬件方案，Nvidia还推出Omniverse Cloud云计算服务，能让创作者、设计师和开发人员使用云计算Omniverse平台，跨区进行3D设计协作和模拟。Omniverse Cloud服务本身提供各种协作和共享工具，如一键协作的Nucleus Cloud功能，还有Omniverse Create功能，可以让多人异地同时参与协作并彼此交互，另外，还推出一支View App，可以使用GeForce NOW流媒体平台查看Omniverse场景模拟和画面渲染的成果。

另外新发布Omniverse kit组件，可以用来创建Omniverse扩展功能、App和微服务，还有提供26个制造格式转换工具，来帮助企业将各种工业作业流程，与Omniverse相连，如Deepsearch、Omniverse Replicator、Omnigraph、Omniverse Avatar。

机器人平台更新方面，Nvidia Drive、Isaac、Metroplis以及Holoscan也都有一些更新。例如推出采用新一代Hyperion 9硬件的Nvidia Drive平台，拥有14个摄影机、9个雷达、3个激光雷达以及20个超音波传感器，可以处理比前一代硬件多2倍的资料量，并加强安全性以及全自驾的操作性，2026年开始出货。

在其他AI服务应用上，对话式AI语音服务Riva正式推出，在最新2.0发布版本中可识别7种语言，而提供推荐系统功能的Merlin也同样已经推出，并发布1.0版本。还有专用于大型自然语言模型训练的NeMo Megatron深度学习框架，除了Azure公有云能用，之后将在AWS上来提供。