AWS重磅上线全球最大AI计算集群,年底将集成百万颗自研芯片,Anthropic已率先接入
亚马逊云科技(AWS)宣布,与AI公司Anthropic合作开发的AI超级集群Project Rainier已于10月29日正式投入使用。该集群目前已集成近50万颗亚马逊自研AI芯片Trainium2,预计到2023年底,将扩展至超过100万颗,用于支持Anthropic旗下AI模型Claude的训练与部署。 Project Rainier是AWS在去年12月启动的大型AI基础设施项目,旨在构建一个覆盖美国多个数据中心的分布式AI计算集群。从宣布到正式上线仅用时不到一年,其规模比AWS此前任何AI平台大出约70%。该系统采用专为AI训练优化的Trainium2芯片,单颗芯片每秒可完成数万亿次计算,专为处理大模型训练所需的海量数据而设计。 数千颗Trainium2芯片通过新型Amazon EC2 UltraServer和EC2 UltraCluster架构互联,实现超高速通信与数据共享,显著提升整体算力效率。Anthropic正利用该集群开发和部署Claude的升级版本,其训练所用的计算能力已远超此前水平,是过去五倍以上。 AWS杰出工程师、Trainium首席架构师罗恩·迪亚曼特表示,Project Rainier是“规模庞大、独一无二的基础设施项目”,将推动下一代AI模型的发展。 值得注意的是,就在Project Rainier上线前夕,亚马逊于10月28日宣布裁员约3万人,显示公司正加速资源重组,将重点向AI和自研芯片等战略领域倾斜。市场关注今日亚马逊发布第三季度财报,AWS的持续增长将成为关键看点。
