NVIDIA Blackwell:重塑超大规模AI推理的新纪元
NVIDIA在2025年CES上正式发布专为超大规模AI推理而生的Blackwell架构,标志着AI计算进入新纪元。核心产品是NVIDIA Grace Blackwell超级芯片,它将两颗Blackwell GPU与一颗NVIDIA Grace CPU深度融合,构成一个统一的计算模块。这种设计通过革命性的NVLink芯片间互联技术实现CPU与GPU之间的无缝通信,支持内存直接共享,显著降低延迟、提升吞吐量,性能相较以往提升一个数量级。 为支撑这一超级芯片的极致算力,NVIDIA打造了名为NVLink Switch的脊柱式架构,由超过5000根高性能铜缆构成,连接18个计算托盘中的72个GPU,实现高达130TB/s的数据传输速率。这一速度足以在不到一秒内传输整个互联网的峰值流量,彻底打破传统AI数据中心的数据瓶颈。 整个NVLink Switch脊柱系统历经精密切割、测量、装配与检测,总长度达两英里,确保每一根铜缆都精准无误。安装前还需进行严格质检,保障系统稳定运行。 在更大规模部署中,NVIDIA Quantum-X800交换机、NVLink Switch与Spectrum-X以太网协同工作,可将多个GB200 NVL72系统无缝整合为一个统一的超大规模AI计算集群,实现无限制的并行通信。 同时,NVIDIA BlueField-3数据处理单元(DPU)承担起非AI任务的卸载与加速,如网络、存储和安全,让AI工作负载获得更纯净的计算资源。例如,CoreWeave等NVIDIA云合作伙伴已部署GB200 NVL72系统,构建高效AI工厂。 更令人瞩目的是,xAI的“Colossus”超级计算机仅用122天建成,集成超过20万颗NVIDIA GPU,充分展现了全栈式、可扩展架构的强大能力。NVIDIA Blackwell不仅是一次芯片革新,更是为下一代AI基础设施奠定的基石。
