亚马逊重磅推出新型AI芯片,暗示未来兼容英伟达生态
亚马逊云科技(AWS)在2025年re:Invent大会上正式发布其第三代AI训练芯片Trainium3,以及搭载该芯片的UltraServer系统,标志着其在自研AI硬件领域迈出关键一步。新系统采用3纳米制程工艺,结合AWS自研网络技术,性能实现显著跃升。 据AWS介绍,Trainium3 UltraServer在AI训练和推理效率上较第二代系统提升超过4倍,内存容量也增加4倍,尤其在高并发场景下表现突出。单个UltraServer可容纳144颗Trainium3芯片,数千台服务器可互联,形成支持最多100万颗芯片的超大规模集群,是上一代系统的10倍。此外,新系统能效比提升40%,在AI数据中心电力消耗日益受关注的背景下,这一优势对降低运营成本意义重大。 AWS强调,这些改进不仅有助于自身降低数据中心能耗,也使客户在使用AI服务时显著节省成本。目前,Anthropic、日本大模型公司Karakuri、SplashMusic和Decart等已开始使用Trainium3,反馈称推理成本大幅下降。 更引人注目的是,AWS透露下一代芯片Trainium4已进入开发阶段。新芯片将支持Nvidia的NVLink Fusion高速互联技术,实现与Nvidia GPU的无缝协同。这意味着未来基于Trainium4的系统可在保持AWS自研低成本服务器架构的同时,兼容主流Nvidia生态,尤其利于吸引依赖CUDA生态的AI应用迁移到AWS云平台。 尽管未公布Trainium4的具体发布时间,但若延续以往节奏,预计将在2026年re:Invent大会上正式亮相。这一布局显示,AWS正通过自研芯片与开放兼容策略双管齐下,强化其在AI基础设施领域的竞争力。
