Amazon が Anthropic、OpenAI、Apple を惹きつけたチップ「Trainium」の最新状況を独占取材
アマゾンと OpenAI が 50 億ドルの投資協定に合意した背景を受け、TechCrunch の記者はオースティンにあるアマゾンの Trainium チップ開発ラボを視察しました。このラボは AWS が NVIDIA の独占に対抗し、人工知能(AI)の学習および推論コストを引き下げるための重要な拠点です。現在、Trainium チップは Anthropic や OpenAI、さらには Apple から高い評価を得ており、特に Anthropic の Claude モデルでは 100 万枚以上の Trainium2 チップ上で稼働しています。今回の提携の中核となるのは、Amazon が OpenAI に最大 2GW の Trainium 計算リソースを提供することにあります。供給が逼迫している状況にもかかわらず、Trainium はその顕著なパフォーマンスとコスト競争力により市場シェアを急速に拡大しています。最新の Trainium3 と新世代の Neuron スイッチを組み合わせたことでチップ間での高効率な相互接続を実現し、従来のクラウドサービスと比較して同程度の性能であれば実行コストを約 50%削減可能です。さらに重要なのは、Trainium が PyTorch を含む主要なオープンソースフレームワークをサポートしており、開発者はごくわずかなコード修正で移行できるため、乗り換えの障壁が大きく低下している点です。チップ自体に加え、アマゾンは冷却技術や仮想化管理プラットフォーム「Nitro」を含む専用サーバーコンポーネントも設計し、エネルギー効率とパフォーマンスのさらなる最適化を図っています。チームはチップの起動段階において高度なエンジニアリング検証を行い、現場での実装やテストを通じて放熱や接続といった難題に取り組んでいます。現在、世界最大の AI 計算クラスターのひとつである「プロジェクト・レイニア」には 50 万枚の Trainium2 チップが導入され、専ら Anthropic のために運用されています。OpenAI の参画が大きな注目を集める中、エンジニアチームの現在の焦点はまだ Anthropic および社内サービスの支援にあり、同時に Trainium4 の開発也已着手済みです。アンディ・ジャシー CEO は自社製チップ事業に対して多大な期待を抱き、これを AWS の将来における核心的成長ドライバーと位置づけています。Trainium が学習と推論の両分野で本格展開されるにつれ、アマゾンは垂直統合型のハードウェアソリューションを通じ、AI インフラストラクチャの構図再編を目指しています。
