戴尔向CoreWeave交付行业首个英伟达Grace Blackwell Ultra超级计算平台
戴尔在周四宣布,已向领先的AI云服务提供商(CSP)CoreWeave交付了基于Nvidia GB300 NVL72平台的首批系统。CoreWeave表示,这些系统已经部署在其数据中心托管合作伙伴Switch的数据中心中。此次部署涉及配备72个Nvidia Blackwell Ultra GPU、36个基于Arm架构的72核Grace CPU以及36个BlueField DPU的戴尔集成机架,每个GB300 NVL72机架可以提供1.1 ExaFLOPS 的密集FP4推理性能和0.36 ExaFLOPS的FP8训练性能,比之前的GB200 NVL平台提高了50%。此外,每个机架还配备了20TB的HBM3E内存和40TB的总内存。新的机架规模解决方案依赖于Nvidia的Quantum-X800 InfiniBand交换机和ConnectX-8 SuperNICs,能够实现高达14.4 GB/s的扩展连接速度,比之前快了一倍。 由于这些系统配置非常密集,功耗极高(每GPU可达1400瓦),所以采用了液体冷却技术。戴尔公司表示,此次交付不仅仅是里程碑,更是客户和合作伙伴对其专业技能的高度信任。“我们在算力、网络和存储方面进行无缝集成与优化,并通过整合和部署服务帮助客户以前所未有的速度和规模推进工作。这种创新与快速执行只有我们才能做到,使我们能够赋能客户并加速与如CoreWeave、Nvidia等合作伙伴的合作。” 这些机架规模的系统都经过预装和测试,设计用于快速安装与部署生产使用。这是戴尔与CoreWeave第二次率先部署Nvidia最新的AI GPU平台。这一成就归功于三方紧密合作,结合硬件、软件和服务,形成一个可以快速部署的整体方案。 此次部署将使CoreWeave能够增强其云平台,更好地处理大型语言模型训练、推理过程和推理任务。随着更多GB300 NVL72机架的加入,其平台上可用的总性能将进一步提高。值得注意的是,距离戴尔和CoreWeave首次部署GB200 NVL72机器刚过去七个月,这让人不禁质疑GB200平台能否在如此短的时间内保持市场竞争力。不过对于CSP来说,投资更高性能的Blackwell Ultra 机器更有意义,因此或许市场上对Nvidia的Blackwell Ultra有着巨大的需求,Nvidia今年下半年的销售额可能会进一步增加。 业内专家表示,戴尔与CoreWeave的合作展示了高性能计算领域的迅速发展和技术快速迭代的趋势。Nvidia作为全球领先的AI计算解决方案提供商,其不断推出更先进的产品为行业带来了巨大推动力。而戴尔凭借其强大 的工程能力和整合能力,在推动新技术落地方面发挥了重要作用。