微软发布AI推理新芯片
微软宣布推出其最新AI芯片Maia 200,定位为专为大规模AI推理(inference)优化的高性能计算芯片。作为2023年推出的Maia 100的升级版,Maia 200在性能与能效上实现显著跃升,搭载超过1000亿个晶体管,支持4位精度下超过10 petaflops的算力,8位精度下约5 petaflops,远超前代产品。 AI推理指模型部署后实际运行、生成结果的过程,与训练阶段不同。随着AI应用落地,推理成本已成为企业运营中的关键支出。微软希望通过Maia 200降低推理功耗、提升效率,减少系统中断,实现更稳定高效的AI服务。公司表示,单个Maia 200节点即可轻松运行当前最大规模的AI模型,并为未来更大模型预留充足空间。 此举也反映出科技巨头正加速推进自研芯片战略,以减少对英伟达GPU的依赖。英伟达凭借其在AI训练与推理领域的领先优势,已成为AI产业的核心硬件供应商。为打破这一格局,谷歌推出TPU(张量处理单元),虽不对外销售芯片,但通过云服务提供算力支持;亚马逊则推出Trainium系列AI加速芯片,最新版Trainium3已于2023年12月发布。微软此次推出Maia 200,正是要在这场芯片竞争中占据一席之地。 据微软介绍,Maia 200在FP4精度下性能为第三代Trainium芯片的3倍,FP8精度表现也优于谷歌第七代TPU。目前,该芯片已用于微软内部“超级智能”团队的AI模型运行,并支撑其Copilot智能助手的日常服务。 此外,微软已向开发者、学术机构及前沿AI实验室开放Maia 200的软件开发工具包(SDK),鼓励外部生态参与测试与应用开发。此举旨在构建围绕自研芯片的开发者生态,推动AI基础设施的多元化与自主可控。随着AI进入规模化落地阶段,芯片自研能力正成为科技公司核心竞争力的重要体现。
