谷歌发布第八代 TPUs 双芯片布局智能体时代
谷歌在 Google Cloud Next 大会上发布了第八代定制张量处理单元(TPU),推出专为训练和推理设计的两款芯片:TPU 8t 和 TPU 8i。这两款芯片旨在应对人工智能代理时代对基础设施的新要求,支持模型训练、代理开发及大规模推理任务。TPU 8t 专为高算力训练负载优化,能将前沿模型的开发生命周期从数月缩短至数周,性能较上一代提升近三倍,并具备极高的任务有效时间指标。TPU 8i 则侧重于高内存带宽,专注于低延迟的推理需求,能有效解决大规模代理交互中的效率瓶颈。 此次发布标志着谷歌在人工智能硬件领域的重大进展。两款芯片均运行于谷歌自研的 Axion ARM 架构 CPU 之上,实现了从处理器到加速器的全栈协同设计,支持 JAX、PyTorch 等主流框架,并提供裸机访问权限。在能效方面,新芯片性能每瓦提升达两倍,得益于集成电源管理、片上网络互联以及第四代液冷技术,数据中心每单位电力的计算能力五年内提升了六倍。 作为谷歌“人工智能超算”(AI Hypercomputer)的核心组件,TPU 8t 和 TPU 8i 将于今年晚些时候全面开放使用。这一举措将推动人工智能从单纯的大模型训练向具备自主规划、执行和循环学习能力的代理系统演进。谷歌希望通过这种定制化架构,进一步巩固其在算力领域的领先地位,同时为开发者和企业提供高效、稳定的基础设施支持,以应对未来更复杂的人工智能应用挑战。
