HyperAI

微软宣布推出其最新AI芯片Maia 200，定位为专为大规模AI推理（inference）优化的高性能计算芯片。作为2023年推出的Maia 100的升级版，Maia 200在性能与能效上实现显著跃升，搭载超过1000亿个晶体管，支持4位精度下超过10 petaflops的算力，8位精度下约5 petaflops，远超前代产品。 AI推理指模型部署后实际运行、生成结果的过程，与训练阶段不同。随着AI应用落地，推理成本已成为企业运营中的关键支出。微软希望通过Maia 200降低推理功耗、提升效率，减少系统中断，实现更稳定高效的AI服务。公司表示，单个Maia 200节点即可轻松运行当前最大规模的AI模型，并为未来更大模型预留充足空间。此举也反映出科技巨头正加速推进自研芯片战略，以减少对英伟达GPU的依赖。英伟达凭借其在AI训练与推理领域的领先优势，已成为AI产业的核心硬件供应商。为打破这一格局，谷歌推出TPU（张量处理单元），虽不对外销售芯片，但通过云服务提供算力支持；亚马逊则推出Trainium系列AI加速芯片，最新版Trainium3已于2023年12月发布。微软此次推出Maia 200，正是要在这场芯片竞争中占据一席之地。据微软介绍，Maia 200在FP4精度下性能为第三代Trainium芯片的3倍，FP8精度表现也优于谷歌第七代TPU。目前，该芯片已用于微软内部“超级智能”团队的AI模型运行，并支撑其Copilot智能助手的日常服务。此外，微软已向开发者、学术机构及前沿AI实验室开放Maia 200的软件开发工具包（SDK），鼓励外部生态参与测试与应用开发。此举旨在构建围绕自研芯片的开发者生态，推动AI基础设施的多元化与自主可控。随着AI进入规模化落地阶段，芯片自研能力正成为科技公司核心竞争力的重要体现。

相关链接

相关链接

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

Command Palette

微软发布AI推理新芯片

相关链接

Command Palette

微软发布AI推理新芯片

相关链接

Command Palette

微软发布AI推理新芯片

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟