NVIDIA DGX SuperPOD 引领鲁宾系统架构新纪元
NVIDIA在拉斯维加斯CES展会上正式推出基于Rubin平台的全新AI计算系统,标志着AI基础设施迈入新阶段。该平台由六款全新芯片协同构成,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太网交换机,通过深度协同设计,显著提升大模型训练效率并大幅降低推理成本。 NVIDIA DGX SuperPOD作为核心部署架构,将支撑基于Rubin平台的大规模系统。新一代DGX Vera Rubin NVL72系统整合8个节点,共配备576块Rubin GPU,提供28.8 exaflops的FP4算力和600TB高速内存。每个系统集成36颗Vera CPU、72块Rubin GPU和18块BlueField-4 DPU,实现全机柜统一内存与计算空间,260TB/s的NVLink总吞吐量彻底消除模型分片需求,使整机柜如同单一AI引擎运行。 另一款DGX Rubin NVL8系统采用液冷设计,每台集成8块Rubin GPU和第六代NVLink,算力相比Blackwell系统提升5.5倍,为各类AI项目提供高效、可扩展的部署路径。两套系统均将于2024年下半年正式推出。 在联网方面,Rubin平台引入新一代800Gb/s端到端网络方案,结合Spectrum-6以太网交换机、Quantum-X800 InfiniBand交换机、BlueField-4 DPU和ConnectX-9 SuperNIC,构建高可靠、低延迟的AI工厂网络,有效解决大规模集群中的拥塞与性能瓶颈。 NVIDIA Mission Control软件将全面支持Rubin平台,实现AI数据中心的自动化运维,涵盖部署配置、集群管理、冷却与电力监控、故障自愈等功能,提升系统稳定性与能效。同时,DGX系统兼容NVIDIA AI Enterprise平台,支持NIM微服务与Nemotron-3等开源模型,加速AI应用落地。 随着Rubin平台的推出,DGX SuperPOD正式成为工业级AI工厂的蓝图,助力企业构建具备长上下文推理、多模态理解与自主智能(agentic AI)能力的下一代前沿模型,推动AI进入更高效、更智能的新时代。
