Google、エージェント時代向け第 8 世代 TPU 2 機種発表
Google はクラウドカンファレンス「Google Cloud Next」で、第八世代の独自 AI チップ「TPU」シリーズを発表しました。これは AI エージェント時代に対応するため、トレーニング用「TPU 8t」と推論用「TPU 8i」の 2 種類の専用アーキテクチャを採用しています。この新世代 TPU は Google DeepMind と共同開発され、Gemini など最新の大規模言語モデルの基盤として機能します。TPU 8t は巨大な計算スループットを備え、複雑なモデルの開発期間を数ヶ月から数週間に短縮できる性能を提供します。特に計算効率が高く、前世代比で 3 倍の処理能力を達成しました。また、信頼性を高める自動検知・迂回機能や光学スイッチ技術により、故障時でもトレーニングを継続するシステムを構築しています。一方、TPU 8i は低遅延が要求される推論ワークロードに最適化されており、膨大なメモリ帯域幅を確保しています。AI エージェントが多数連携する環境でも、わずかな非効率による遅延を防ぎます。両チップは、Google の ARM 基盤 CPU「Axion」上で動作し、JAX や PyTorch などの主要フレームワークをネイティブにサポートします。さらに、仮想化のオーバーヘッドを排除するベアメタルアクセスも提供され、開発者は直接ハードウェアを利用できます。電力効率においても大きな進歩があり、両チップとも前世代比で消費電力あたりの性能が最大 2 倍向上しています。これは、チップ内のネットワーク統合や、第四世代の液体冷却技術など、ハードウェアからデータセンター全体のシステムレベルでの最適化によるものです。これらの TPU は、今年後半から一般提供され、Google の AI ハイパーコンピューターの一部として利用可能です。AI エージェントの自律的な推論や学習ループを処理するインフラとして、業界の標準となることを目指しています。
