AWS 对自研 Trainium AI 加速器前景充满信心
亚马逊云科技(AWS)对其自研AI加速器Trainium系列表现出强烈信心。在最新财报电话会上,CEO安迪·贾西(Andy Jassy)透露,Trainium2已实现全面满载,业务规模达到数十亿美元级别,营收较上一季度增长2.5倍。该芯片已广泛用于AWS的SageMaker和Bedrock AI平台,不仅支持AI训练,也承担推理任务,显示出其在GenAI时代的重要地位。 据透露,Trainium2的性能比市场上其他方案高出30%至40%,且目前AWS上超过一半的Bedrock推理请求已由Trainium芯片处理。更引人注目的是,AWS与Anthropic合作打造的“Project Ranier”超级集群,已部署50万颗Trainium2芯片,预计年底将扩展至100万颗,性能是此前Claude 3训练所用GPU集群的5倍。 下一代Trainium3也已进入关键阶段。该芯片采用台积电3纳米制程,性能为Trainium2的2倍,能效提升40%,预计2025年底开启预览,2026年初实现大规模出货。贾西表示,已有大量中大型客户对Trainium3表现出浓厚兴趣,未来可支持更大规模的AI模型训练集群。 AWS正通过自研加速器与第三方GPU(如NVIDIA Blackwell)并行发展,既控制成本,又满足不同客户对算力的需求。目前,AWS的AI基础设施投资中,约35%用于Trainium,65%用于GPU。但随着Trainium规模扩大,预计到2026至2027年,其在AI算力部署中占比将达50%以上,而资金投入仍以GPU为主,因租用价格更高。 在基础设施方面,AWS在过去12个月新增3.8吉瓦(GW)数据中心容量,第四季度还将再增1GW。预计到2027年,AWS总容量将翻倍,从2022年的约4GW增至20GW。按每GWAI基础设施投资约370亿至500亿美元估算,未来两年AWS在AI数据中心的投入将达4000亿至4500亿美元。 2025年第三季度,AWS营收达330亿美元,同比增长20.2%;系统业务(计算+存储+网络)收入达194.7亿美元,增长33.8%。在GenAI推动下,计算收入正快速逼近甚至可能超过软件服务收入,标志着AWS正从“服务主导”转向“算力驱动”的新阶段。