Nvidia DLSS 4 最新更新:Transformer 模型 VRAM 使用量减少 20%,性能更优
Nvidia在最近发布的DLSS 4版本中不仅将其从测试版移出,还对其最新的DLSS SDK进行了VRAM(视频内存)优化。据报道,新的DLSS 310.3.0版本通过优化Transformer模型的内存使用,使VRAM消耗减少了20%。此前,Transformer模型的内存消耗几乎是其前代CNN模型的两倍。现在,新的Transformer模型内存消耗仅比CNN模型多40%。 具体来看,在1080p分辨率下,旧的Transformer模型需要106.9MB的VRAM,而新版则只需85.77MB;相比之下,CNN模型只需要60.83MB的VRAM。随着分辨率的提高,DLSS的内存消耗成线性增加。以4K分辨率为例,新的Transformer模型需要307.37MB的VRAM,而旧版则需要387.21MB。8K分辨率下,新Transformer模型的内存消耗为1,225.17MB(约1.2GB),比旧版的1,517.60MB(约1.5GB)有所减少。 尽管这些优化可能在实际应用中并不容易被用户察觉,但考虑到现代显卡的VRAM容量,80MB(甚至更少)的减少确实微乎其微。唯一可能出现显著影响的情况是在8K分辨率下,即使经过优化,新的Transformer模型仍然消耗超过1GB的内存。 然而,从技术角度来看,Nvidia能够在保持Transformer模型强大性能的同时减少20%的内存消耗是一项了不起的成就。尤其是在图像质量方面,新的DLSS 4变压器模型拥有两倍于前代CNN模型的参数数量,能够生成接近原生的高质量图像。这一改进预计未来会进一步优化,就像Nvidia在DLSS 3.8.10版本中的做法一样。 此外,Nvidia还推出了DLSS 4的重要帧生成功能,其VRAM消耗比前一代减少了30%。帧生成的VRAM消耗远高于图像缩放部分。例如,Nvidia在其博客中提到,《战锤40000:暗潮》在开启DLSS 4帧生成时,4K分辨率下的VRAM消耗比开启DLSS 3帧生成时减少了400MB。这种优化不仅有助于提升游戏性能,还能让一些高端显卡在更高分辨率下运行得更加流畅。 这次的VRAM优化主要针对Transformer图像缩放模型,而不涉及帧生成部分。总体而言,通过这些改进,Nvidia继续增强了DLSS 4的性能,使其在高分辨率和高性能需求的游戏和应用中表现出色。 业内人士普遍认为,Nvidia在DLSS 4的持续优化中展示了其强大的技术研发能力,尤其在内存管理和性能提升方面的进步令人印象深刻。这不仅巩固了Nvidia在图形处理领域的领先地位,也为未来的视觉技术发展奠定了坚实的基础。Nvidia是一家全球领先的GPU制造商,以其在游戏、专业可视化、数据中心和自动驾驶汽车领域的创新而闻名。