Nvidia推出最新通用GPU L4，Google云计算率先推出搭载L4的G2 VM

Nvidia新一代通用L4 Tensor Core GPU是T4 GPU的后继者，适用于视频、视觉计算、图形、虚拟化、生成人工智能等广泛应用，L4可达T4 GPU 2.7倍的生成式人工智能性能，图形性能上升达4倍，人工智能视频工作管线更可支持即时运算，特别的是，由于L4添加FP8支持，因此能够更好地执行机器学习推理运算。

L4 GPU采用第4代张量核心的Ada Lovelace架构，以及第3代RT核心，拥有高达24 GB GDDR6的显卡内存，支持Shader execution reordering技术，能够改善着色性能，同时也支持包括AV1解编码等图像和视频硬件加速处理引擎。

在FP32精度性能可达30 TFLOPS，在FP16精度下，更能拥有高达运算能力242 TFLOPs，而且L4 GPU除了INT8、BFLOAT16和TF32精度之外，还添加支持FP8，使得L4 GPU更适合执行机器学习推理工作负载。

L4 GPU的各项性能都高于T4 GPU数倍，除了生成式人工智能性能的执行性能提升至2.7倍之外，由于第3代RT核心以及人工智能加持的DLSS 3，L4能够胜任图形密集运算工作，在Omniverse、云计算游戏和虚拟工作站上，可以提供4倍于T4的图形性能，甚至可以用于即时计算电影品质的场景。

新GPU在影音处理上也马力十足，搭载L4 GPU的服务器能够以720p30的分辨率，同时支撑超过1,000个AV1视频流媒体，此外，L4 GPU还可以将多种分辨率和格式流媒体传输至多个平台，进而支持在社交媒体平台等更多频道上的视频播放。

而在Nvidia推出L4 GPU的同时，Google也发布首款采用L4 GPU的虚拟机G2，Google提到，从A10G GPU切换使用L4 GPU，基础设施的成本可下降达40%，而从L4 GPU切换至T4 GPU，则可获得2到4倍的性能提升。Google优化Vertex AI对G2虚拟机的支持，供用户使用最新的生成式人工智能模型和技术，而无序额外调校。