HyperAI超神经

Nvidia在最近发布的DLSS 4版本中不仅将其从测试版移出，还对其最新的DLSS SDK进行了VRAM（视频内存）优化。据报道，新的DLSS 310.3.0版本通过优化Transformer模型的内存使用，使VRAM消耗减少了20%。此前，Transformer模型的内存消耗几乎是其前代CNN模型的两倍。现在，新的Transformer模型内存消耗仅比CNN模型多40%。具体来看，在1080p分辨率下，旧的Transformer模型需要106.9MB的VRAM，而新版则只需85.77MB；相比之下，CNN模型只需要60.83MB的VRAM。随着分辨率的提高，DLSS的内存消耗成线性增加。以4K分辨率为例，新的Transformer模型需要307.37MB的VRAM，而旧版则需要387.21MB。8K分辨率下，新Transformer模型的内存消耗为1,225.17MB（约1.2GB），比旧版的1,517.60MB（约1.5GB）有所减少。尽管这些优化可能在实际应用中并不容易被用户察觉，但考虑到现代显卡的VRAM容量，80MB（甚至更少）的减少确实微乎其微。唯一可能出现显著影响的情况是在8K分辨率下，即使经过优化，新的Transformer模型仍然消耗超过1GB的内存。然而，从技术角度来看，Nvidia能够在保持Transformer模型强大性能的同时减少20%的内存消耗是一项了不起的成就。尤其是在图像质量方面，新的DLSS 4变压器模型拥有两倍于前代CNN模型的参数数量，能够生成接近原生的高质量图像。这一改进预计未来会进一步优化，就像Nvidia在DLSS 3.8.10版本中的做法一样。此外，Nvidia还推出了DLSS 4的重要帧生成功能，其VRAM消耗比前一代减少了30%。帧生成的VRAM消耗远高于图像缩放部分。例如，Nvidia在其博客中提到，《战锤40000：暗潮》在开启DLSS 4帧生成时，4K分辨率下的VRAM消耗比开启DLSS 3帧生成时减少了400MB。这种优化不仅有助于提升游戏性能，还能让一些高端显卡在更高分辨率下运行得更加流畅。这次的VRAM优化主要针对Transformer图像缩放模型，而不涉及帧生成部分。总体而言，通过这些改进，Nvidia继续增强了DLSS 4的性能，使其在高分辨率和高性能需求的游戏和应用中表现出色。业内人士普遍认为，Nvidia在DLSS 4的持续优化中展示了其强大的技术研发能力，尤其在内存管理和性能提升方面的进步令人印象深刻。这不仅巩固了Nvidia在图形处理领域的领先地位，也为未来的视觉技术发展奠定了坚实的基础。Nvidia是一家全球领先的GPU制造商，以其在游戏、专业可视化、数据中心和自动驾驶汽车领域的创新而闻名。

相关链接

相关链接

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

Command Palette

Nvidia DLSS 4 最新更新：Transformer 模型 VRAM 使用量减少 20%，性能更优

相关链接

Command Palette

Nvidia DLSS 4 最新更新：Transformer 模型 VRAM 使用量减少 20%，性能更优

相关链接

Command Palette

Nvidia DLSS 4 最新更新：Transformer 模型 VRAM 使用量减少 20%，性能更优

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟