谷歌云近日宣布将提供G2虚拟机的非公开预览,成为首家提供NVIDIA L4 Tensor Core GPU的云服务商。此外,L4 GPU将在Vertex AI上提供优化支持,该平台现在支持构建、调整和部署大型生成式AI模型。
NVIDIA新一代通用L4 Tensor Core GPU,适用于视频、视觉计算、图形、虚拟化、生成人工智能等广泛应用。L4可达T4 GPU 2.7倍的生成式人工智能性能,图形性能上升达4倍,人工智能视频工作管线更可支持即时运算,特别的是,由于L4添加FP8支持,因此能够更好地执行机器学习推理运算。
NVIDIA L4 Tensor Core GPU采用第4代张量核心的Ada Lovelace架构,以及第3代RT核心,拥有高达24 GB GDDR6的显卡内存,支持Shader execution reordering技术,能够改善着色性能,同时也支持包括AV1解编码等图像和视频硬件加速处理引擎。
在FP32精度性能可达30 TFLOPS,在FP16精度下,更能拥有高达运算能力242 TFLOPs,而且L4 GPU除了INT8、BFLOAT16和TF32精度之外,还添加支持FP8,使得L4 GPU更适合执行机器学习推理工作负载。
L4 GPU的各项性能都高于T4 GPU数倍,除了生成式人工智能性能的执行性能提升至2.7倍之外,由于第3代RT核心以及人工智能加持的DLSS 3,L4能够胜任图形密集运算工作,在Omniverse、云计算游戏和虚拟工作站上,可以提供4倍于T4的图形性能,甚至可以用于即时计算电影品质的场景。
新GPU在影音处理上非常出色,搭载L4 GPU的服务器能够以720p 30的分辨率,同时支撑超过1000个AV1视频流媒体,此外,L4 GPU还可以将多种分辨率和格式流媒体传输至多个平台,进而支持在社交媒体平台等更多频道上的视频播放。