华为发布Atlas 350 AI加速器 算力达1.56 PFLOPS FP4
2026 年,华为在深圳举办的“华为中国伙伴大会”上正式推出了全新 AI 加速器 Atlas 350。该芯片基于华为自研的昇腾 950PR 架构,旨在推动中国人工智能领域的完全自主可控,标志着国产 AI 算力取得重大突破。Atlas 350 专为 AI 大模型推理中的预填充阶段设计,理论算力达到 1.56 PFLOPS(FP4 精度)。华为宣称其性能比英伟达专供中国的 H20 芯片高出 2.87 倍,尽管由于 Hopper 架构不支持原生 FP4,该对比数据难以独立验证,但这是国产首款针对 FP4 精度优化的加速器。 在存储与连接方面,Atlas 350 最高配备 112GB HBM 内存,内存带宽为 1.6TB/s,并支持 2TB/s 的互联带宽,采用华为新推出的灵衢协议,互联速度是上一代昇腾 910 系列的 2.5 倍。值得注意的是,芯片功耗为 600 瓦,比英伟达 H20 高出 200 瓦。受限于美国制裁,华为无法使用台积电 CoWoS 先进封装技术,因此采用了其他先进封装方案,并自研内存以与海力士、美光等国际厂商竞争。 关于上市与定价,华为虽未公布确切发售日期,但履行了此前关于 2026 年第一季度交付昇腾 950PR 的承诺。市场消息称,Atlas 350 的定价约为 11.1 万元人民币,折合 1.6 万美元左右,与英伟达 H20 的区域售价区间相当。尽管目前中国企业在实际应用中仍大量依赖英伟达成熟的 CUDA 生态,且部分未阉割的英伟达芯片仍有竞争力,但 Atlas 350 的发布无疑是国产算力缩小与国外差距、实现技术独立的重要一步。
