AMD、MI350XとMI355X AI GPU発表、最大4倍の性能向上と35倍速い推論を謳う、MI355Xは1400ワット消費予定
AMD 新世代GPU「MI350X」および「MI355X」発表 AMD社はカリフォルニア州サンノゼで開催された「Advancing AI 2025」イベントにおいて、新世代のAIワークロード用GPU「MI350X」と「MI355X」の発表を行った。この新アーキテクチャは、前の世代「MI300X」比で最大3倍のパフォーマンス向上を謳っており、市場リーダー인Nvidia社に対抗する戦略の一環として位置付けられている。AMDは、推奨価格での実質的な性能向上を重視し、「MI350X」は空冷、「MI355X」は水冷で利用可能な高パフォーマンスモデルとして提供される。 主な関係者や組織 AMD社(主な発表者) Nvidia社(競合他社) TSMC(製造パートナー) 出来事の時系列と背景 2023年: AMDは「MI300X」を発表。 2025年: AMDは「Advancing AI 2025」イベントで「MI350X」と「MI355X」の発表。 2026年以降: 「MI400」シリーズへの展開予定。 出来事の原因、経過、結果 AMDはAIとHPC(高性能計算)市場の競争力を高めるために、以前の世代から大幅な性能向上を目指していた。「MI350X」と「MI355X」は、「CDNA 4」アーキテクチャを採用し、より高度な製造プロセス(TSMCのN3Pプロセスノード)を活用することで、大きな性能向上を達成した。主な改善点は以下の通り: - メモリ容量: 288GB HBM3E(「MI350X」/「MI355X」) - メモリ帯域幅: 8 TB/s - 性能: FP4/FP6性能が「MI350X」では18.45 PFLOPS、「MI355X」では20.1 PFLOPSに上昇。 FP16やFP8性能でも競合他社に匹敵するレベルに達した。 これらの新モデルにより、AMDはデータセンター向けのrack-levelソリューションにおいて競争優位性を確保し、より多くのパフォーマーンスを単一ラックに詰め込むことが可能となった。これにより性能費用効果が向上し、顾客の総所有コスト(TCO)が軽減される。 重要な事実、突破口、転機 FP6とFP4のサポート: 新たにFP4とFP6精度フォーマットを導入。特にFP6がFP4レートで動作し、差別化の要素となっている。 メモリ容量:「MI355X」は競合他社Nvidiaの GB200とB200よりも1.6倍多いメモリ容量を誇るが、メモリバンド幅は同等。 冷却方法:「MI350X」は空冷用デザイン、「MI355X」は水冷用デザインが主となり、最大消費電力は空冷1,000W、水冷1,400W。 性能比較: AMDは自社の新しいGPUがNvidiaの競合製品に対して、推論では1.3倍速く、一部のトレーニングワークロードでは1.13倍以上の性能を示すと主張している。 APU版の非開発: CPUとGPUコアが統合されたAPU版は今世代で開発されず、GPUのみの設計に特化。 関連する背景情報 AMDは新世代GPUの開発にあたり、製造プロセスの改善とメモリ帯域の拡大を重視した。チップ組立は3Dおよび2.5Dパッケージング技術を用いており、特に3DパッケージングはAccelerator Compute Dies(XCD)とI/O Dies(IOD)の结合に使用されている。一方、2.5Dパッケージングは各IOD同士や12-Hi HBM3Eスタックとの接続に使われている。これにより、トランジスタ数が185億個に増加し、計算性能とメモリ帯域が大幅に向上した。 さらに、AMDはSupermicro、Dell、HPEなどの主要OEMと提携し、rack-scaleアーキテクチャの強化に注力している。これによって、複数のGPUを効率的に配置できるようになり、大規模データセンタ向けのソリューションを提供することが可能となった。 Supercomputersの未来 AMDの最高技術責任者マーク・ペーパーマスター氏は、「ISC 2025」イベントで、未来の超並列計算における重要な課題について演説を行った。同氏は、将来のzettascale(10^21 flops)クラスの性能を達成するために、CPUと加速器の一層の発展が必要であると指摘。しかし、性能向上に伴う消費電力の急速な増大が問題になると警告した。 理論的パフォーマンスと消費電力の進化 過去のデータによれば、トップクラスのスーパーコンピュータの計算性能は1.2年ごとに2倍のペースで成長している。例えば、1990年代後半にはCPUだけのシステムが中心だったが、2005年頃からはCPUとGPU・加速器を混在したヘテロジニアスアーキテクチャが主流となり、現在ではAI専用ハードウェアが中心となっている。 計算性能の進化に連動して、消費電力も増加の一途を辿っている。「MI300X」が2023年に750W消費したのに対し、「MI355X」は1,400Wまで増え、将来の「MI400」シリーズでは1,600W以上にもなる可能性がある。Nvidia社の「Rubin Ultra」のような競合製品では、最大で3,600Wに達する可能性が指摘されている。 効率性の向上 消費電力の増大に伴い、性能効率の急速な改善が不可欠となっている。例えば、2010年には3.2 GFLOPS/Wの水平にあったのが、exascaleシステムであるFrontierが出た現在では52 GFLOPS/Wに向上している。将来、zettascaleシステムでは2,140 GFLOPS/Wの効率が必要とされ、それには2.2年ごとのエネルギー効率の倍増が求められる。 AMDは、超並列計算の性能向上と消費電力の管理という両立が課題であり、それにはアーキテクチャの革新だけでなく業界全体が记忆力帯域の適切なスケーリングを追求する必要があると提起した。核融合炉など、新たなエネルギーソースの利用も2030年代には現実味を帯びてくる可能性がある。 背景の補足 専門家たちからは、AMDの新モデルには高い期待が寄せられているものの、ベンダープロバイドのベンチマークは慎重に評価すべきであるという意見が聞かれる。また、AMDが競合他社Nvidiaに対して性能面で優位性を持つことが確認できた場合、業界全体の競争環境に影響を与える可能性が高い。AMD社は、高性能計算分野での存在感を示すために、これらの新製品の発売と共に広範なパートナーシップを強化しており、今後もAI市場での発展が期待されている。