HyperAI超神经

近日，在MLCommons发布的MLPerf Training v6.0基准测试中，英伟达Blackwell平台以绝对优势包揽全部七项榜单。测试新增DeepSeek-V3 671B与GPT-OSS-20B等混合专家架构预训练任务，英伟达成为唯一提交全部项目的厂商，且各项训练耗时均为行业第一。凭借GB200 NVL72系统，英伟达完成高达8192张GPU的集群扩展，刷新该测试最大规模纪录。新一代GB300 NVL72系统受更高计算密度与内存容量驱动，较前代提速达1.6倍。此次成绩得益于软硬件深度协同：通过全迭代CUDA图技术、CuTe DSL内核融合及低精度训练优化，平台彻底消除CPU同步瓶颈，使复杂MoE模型的通信开销完全隐于计算之后。配合Spectrum-X以太网与量子InfiniBand的高效路由调度，大规模集群保持近乎理论极限的有效带宽。针对长周期训练需求，平台内置的可靠性引擎可自动规避硬件故障并毫秒级重路由，大幅降低断点重启成本。目前，CoreWeave、Google Cloud等生态伙伴已依托该架构实现模型训练效率成倍提升。英伟达通过全栈协同设计与持续软件迭代，将理论算力高效转化为实际生产力，进一步巩固了其在前沿AI基础设施领域的主导地位。

相关链接

相关链接

相关链接

4 步出图/4K 画质/6 倍提速，PiD 用像素扩散统一解码与超分辨率输出；SA-3DAO：包含 1000 组真实图像与艺术家手工 3D 网格配对的数据集

4 步出图/4K 画质/6 倍提速，PiD 用像素扩散统一解码与超分辨率输出；SA-3DAO：包含 1000 组真实图像与艺术家手工 3D 网格配对的数据集

Command Palette

NVIDIA Blackwell平台在MLPerf Training 6.0中全面领先

相关链接

Command Palette

NVIDIA Blackwell平台在MLPerf Training 6.0中全面领先

相关链接

Command Palette

NVIDIA Blackwell平台在MLPerf Training 6.0中全面领先

相关链接

4 步出图/4K 画质/6 倍提速，PiD 用像素扩散统一解码与超分辨率输出；SA-3DAO：包含 1000 组真实图像与艺术家手工 3D 网格配对的数据集

4 步出图/4K 画质/6 倍提速，PiD 用像素扩散统一解码与超分辨率输出；SA-3DAO：包含 1000 组真实图像与艺术家手工 3D 网格配对的数据集