Nvidia推出最新通用GPU L4,Google云计算率先推出搭载L4的G2 VM

Nvidia新一代通用L4 Tensor Core GPU是T4 GPU的后继者,适用于视频、视觉计算、图形、虚拟化、生成人工智能等广泛应用,L4可达T4 GPU 2.7倍的生成式人工智能性能,图形性能上升达4倍,人工智能视频工作管线更可支持即时运算,特别的是,由于L4添加FP8支持,因此能够更好地执行机器学习推理运算。

L4 GPU采用第4代张量核心的Ada Lovelace架构,以及第3代RT核心,拥有高达24 GB GDDR6的显卡内存,支持Shader execution reordering技术,能够改善着色性能,同时也支持包括AV1解编码等图像和视频硬件加速处理引擎。

在FP32精度性能可达30 TFLOPS,在FP16精度下,更能拥有高达运算能力242 TFLOPs,而且L4 GPU除了INT8、BFLOAT16和TF32精度之外,还添加支持FP8,使得L4 GPU更适合执行机器学习推理工作负载。

L4 GPU的各项性能都高于T4 GPU数倍,除了生成式人工智能性能的执行性能提升至2.7倍之外,由于第3代RT核心以及人工智能加持的DLSS 3,L4能够胜任图形密集运算工作,在Omniverse、云计算游戏和虚拟工作站上,可以提供4倍于T4的图形性能,甚至可以用于即时计算电影品质的场景。

新GPU在影音处理上也马力十足,搭载L4 GPU的服务器能够以720p30的分辨率,同时支撑超过1,000个AV1视频流媒体,此外,L4 GPU还可以将多种分辨率和格式流媒体传输至多个平台,进而支持在社交媒体平台等更多频道上的视频播放。

而在Nvidia推出L4 GPU的同时,Google也发布首款采用L4 GPU的虚拟机G2,Google提到,从A10G GPU切换使用L4 GPU,基础设施的成本可下降达40%,而从L4 GPU切换至T4 GPU,则可获得2到4倍的性能提升。Google优化Vertex AI对G2虚拟机的支持,供用户使用最新的生成式人工智能模型和技术,而无序额外调校。