Nvidia年度GTC大会一连发布新架构GPU、CPU产品及AI超级计算机

在2022 GTC技术大会上,Nvidia首席执行官黄仁勋在主题演讲中,一连发布采用新架构的GPU、CPU产品及其超级计算机系统,另外针对3D设计协作与模拟平台Omniverse,在今年也有重要发布,推出专用模拟运算服务器,以及云计算服务。

一开场没多久,黄仁勋就介绍新一代GPU产品Nvidia H100出场,新GPU不论制程和架构都翻新,采用全新Hopper架构设计,搭配先进4纳米制程,其内置晶体管数量高达800亿个。根据该公司数据,在浮点运算性能上,采用新架构的H100,较前一代Ampere架构A 100性能获得显著提升,在FP8精度浮点运算次数提高6倍,达到4 petaFLOPS,另外在半精度(FP16)则有来到每秒2 petaFLOPS的提升。

Nvidia强调,新GPU适合用于加速Transformer模型训练,因为在Hopper架构中,内置Transformer引擎,包括一个新的Tensor core和使用FP8和FP16精度格式的软件,以及搭配动态处理层的Transformer网络,来优化Transformer模型训练。

这款新GPU也是第一款支持机密运算的GPU产品,改以云计算实例来提供时,每个Hopper GPU内多个实例,都可以使用机密运算,来创建一个值得信赖的云计算环境,保护硬件内资料和应用。该款GPU也是第一款同时支持PCIe 5.0及HBM3高带宽内存的GPU产品。单一颗H100处理器可以提供每秒40Tb的I/O带宽。

Nvidia还推出采用新GPU的新一代AI超级计算机系统DGX H100,使用8个H100 GPU组成,性能可达到32 petaFLOPS以及拥有24 TB/s的内存带宽和640GB的HBM3高带宽内存。

如果搭配新一代NVLink交换机系统,最多可以连接32台DGX(合计256颗H100 GPU),创建H100 DGX POD集群,性能可达到1 exaFLOPS。

Nvidia还推出使用18个DGX POD(一共576台DGX,合计4,608个H100 GPU)打造的Nvidia EOS超级计算机系统,宣称在AI应用上,可以提供18.4 exaFLOPS的处理性能,比当今速度最快的日本富岳超级计算机还快4倍。

除了GPU产品,在CPU产品方面也有更多布局,除了首款Grace CPU产品将在明年正式出货,该公司推出Grace Hopper超级芯片,集成了Hopper架构GPU与Grace CPU并通过NVLink C2C互联,传输速度可达900 GB/s。除此之外,还有一款双Grace CPU芯片组的超级芯片在这次大会中发布,可以提供最多144个核心,拥有396MB缓存,支持LPDDR5X ECC内存,带宽高达1TB/s。

Nvidia表示,Grace CPU也能使用各种Nvidia软件平台,包括Nvidia RTX、HPC、Nvidia AI以及Omnverse等。

除了更新GPU、CPU产品,Nvidia这次更新超过60个SDK,提供更多功能和应用加速。例如这次推出名为Sionna的新SDK,可提供6G通信研究的AI框架,另外物理机器学习模型框架Modulus以及开源医疗图片处理的AI框架Monai,也都重新优化。

这几年,Nvidia力推的3D设计协作与模拟平台Omniverse,在今年GTC大会中也有重要更新。从Omniverse发展来看,在去年元宇宙掀起的热潮下,也让Omniverse发展迅速,Omniverse生态系统也逐渐壮大,从去年8家,到今年增长到82家,包括Adobe、Epic、Bentley等软件都可以支持Omniverse,目前已有10.6万名用户,和累计超过15万次下载。

Nvidia还介绍了一款Omniverse专用的OVX服务器,可供企业打造自己的数字分身应用,这款服务器是由8个A40 RTX GPU、2个Intel Ice Lake CPU和3个CX6 NIC组成,内置1TB系统内存,和16TB NVMe存储,另外同样可以SuperPOD来扩展,最多可以使用32台OVX创建运算集群。目前OVX服务器正式推出。

除了提供本地部署的Omniverse硬件方案,Nvidia还推出Omniverse Cloud云计算服务,能让创作者、设计师和开发人员使用云计算Omniverse平台,跨区进行3D设计协作和模拟。Omniverse Cloud服务本身提供各种协作和共享工具,如一键协作的Nucleus Cloud功能,还有Omniverse Create功能,可以让多人异地同时参与协作并彼此交互,另外,还推出一支View App,可以使用GeForce NOW流媒体平台查看Omniverse场景模拟和画面渲染的成果。

另外新发布Omniverse kit组件,可以用来创建Omniverse扩展功能、App和微服务,还有提供26个制造格式转换工具,来帮助企业将各种工业作业流程,与Omniverse相连,如Deepsearch、Omniverse Replicator、Omnigraph、Omniverse Avatar。

机器人平台更新方面,Nvidia Drive、Isaac、Metroplis以及Holoscan也都有一些更新。例如推出采用新一代Hyperion 9硬件的Nvidia Drive平台,拥有14个摄影机、9个雷达、3个激光雷达以及20个超音波传感器,可以处理比前一代硬件多2倍的资料量,并加强安全性以及全自驾的操作性,2026年开始出货。

在其他AI服务应用上,对话式AI语音服务Riva正式推出,在最新2.0发布版本中可识别7种语言,而提供推荐系统功能的Merlin也同样已经推出,并发布1.0版本。还有专用于大型自然语言模型训练的NeMo Megatron深度学习框架,除了Azure公有云能用,之后将在AWS上来提供。