HyperAI超神经

戴尔在周四宣布，已向领先的AI云服务提供商（CSP）CoreWeave交付了基于Nvidia GB300 NVL72平台的首批系统。CoreWeave表示，这些系统已经部署在其数据中心托管合作伙伴Switch的数据中心中。此次部署涉及配备72个Nvidia Blackwell Ultra GPU、36个基于Arm架构的72核Grace CPU以及36个BlueField DPU的戴尔集成机架，每个GB300 NVL72机架可以提供1.1 ExaFLOPS 的密集FP4推理性能和0.36 ExaFLOPS的FP8训练性能，比之前的GB200 NVL平台提高了50%。此外，每个机架还配备了20TB的HBM3E内存和40TB的总内存。新的机架规模解决方案依赖于Nvidia的Quantum-X800 InfiniBand交换机和ConnectX-8 SuperNICs，能够实现高达14.4 GB/s的扩展连接速度，比之前快了一倍。由于这些系统配置非常密集，功耗极高（每GPU可达1400瓦），所以采用了液体冷却技术。戴尔公司表示，此次交付不仅仅是里程碑，更是客户和合作伙伴对其专业技能的高度信任。“我们在算力、网络和存储方面进行无缝集成与优化，并通过整合和部署服务帮助客户以前所未有的速度和规模推进工作。这种创新与快速执行只有我们才能做到，使我们能够赋能客户并加速与如CoreWeave、Nvidia等合作伙伴的合作。” 这些机架规模的系统都经过预装和测试，设计用于快速安装与部署生产使用。这是戴尔与CoreWeave第二次率先部署Nvidia最新的AI GPU平台。这一成就归功于三方紧密合作，结合硬件、软件和服务，形成一个可以快速部署的整体方案。此次部署将使CoreWeave能够增强其云平台，更好地处理大型语言模型训练、推理过程和推理任务。随着更多GB300 NVL72机架的加入，其平台上可用的总性能将进一步提高。值得注意的是，距离戴尔和CoreWeave首次部署GB200 NVL72机器刚过去七个月，这让人不禁质疑GB200平台能否在如此短的时间内保持市场竞争力。不过对于CSP来说，投资更高性能的Blackwell Ultra 机器更有意义，因此或许市场上对Nvidia的Blackwell Ultra有着巨大的需求，Nvidia今年下半年的销售额可能会进一步增加。业内专家表示，戴尔与CoreWeave的合作展示了高性能计算领域的迅速发展和技术快速迭代的趋势。Nvidia作为全球领先的AI计算解决方案提供商，其不断推出更先进的产品为行业带来了巨大推动力。而戴尔凭借其强大的工程能力和整合能力，在推动新技术落地方面发挥了重要作用。

戴尔向CoreWeave交付行业首个英伟达Grace Blackwell Ultra超级计算平台

Related Links