HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA Blackwell平台在MLPerf Training 6.0中全面领先

近日,在MLCommons发布的MLPerf Training v6.0基准测试中,英伟达Blackwell平台以绝对优势包揽全部七项榜单。测试新增DeepSeek-V3 671B与GPT-OSS-20B等混合专家架构预训练任务,英伟达成为唯一提交全部项目的厂商,且各项训练耗时均为行业第一。 凭借GB200 NVL72系统,英伟达完成高达8192张GPU的集群扩展,刷新该测试最大规模纪录。新一代GB300 NVL72系统受更高计算密度与内存容量驱动,较前代提速达1.6倍。此次成绩得益于软硬件深度协同:通过全迭代CUDA图技术、CuTe DSL内核融合及低精度训练优化,平台彻底消除CPU同步瓶颈,使复杂MoE模型的通信开销完全隐于计算之后。配合Spectrum-X以太网与量子InfiniBand的高效路由调度,大规模集群保持近乎理论极限的有效带宽。 针对长周期训练需求,平台内置的可靠性引擎可自动规避硬件故障并毫秒级重路由,大幅降低断点重启成本。目前,CoreWeave、Google Cloud等生态伙伴已依托该架构实现模型训练效率成倍提升。英伟达通过全栈协同设计与持续软件迭代,将理论算力高效转化为实际生产力,进一步巩固了其在前沿AI基础设施领域的主导地位。

相关链接