HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA Blackwell Ultra、エージェント型AIで最大50倍の性能向上と35倍のコスト削減を実現

NVIDIAの最新AIプラットフォーム「Blackwell Ultra」が、エージェント型AI(agentic AI)のパフォーマンスと経済性において顕著な進化を実現した。新データによると、Blackwell Ultraを搭載したGB300 NVL72システムは、従来のHopperプラットフォームと比べて、1メガワットあたりの処理量が最大50倍向上し、1トークンあたりのコストは最大35倍低減された。特に、複数ステップの作業やリアルタイム対応が求められるエージェント型AIやコードアシスタントに最適な低遅延・長文脈処理において、大きな効果が発揮されている。 Agentic AIの需要は急増しており、OpenRouterの調査では、ソフトウェア開発関連のAIクエリが1年前の11%から約50%にまで拡大。このようなワークロードは、コードベース全体を理解するための長文脈処理と、リアルタイムでの応答性を両立する必要がある。Blackwell Ultraは、次世代GPUとNVIDIAのソフトウェア最適化技術(TensorRT-LLM、Dynamo、Mooncake、SGLang)を統合し、低遅延と長文脈処理の両面で画期的な性能を実現。GB300 NVL72は、128,000トークンの入力と8,000トークンの出力に対応する長文脈処理でも、GB200 NVL72と比べて最大1.5倍のコスト削減を実現した。 Microsoft、CoreWeave、OCIなどの主要クラウドプロバイダーがGB300 NVL72を本格的に導入。特にCoreWeaveのエンジニアリング上級副社長Chen Goldberg氏は、「インフェンスがAIの中心に移行する中、トークン効率と長文脈性能が不可欠。GB300はその課題を直接解決し、顧客に予測可能なパフォーマンスとコスト効率を提供する」と評価した。 さらに、将来の次世代プラットフォームとして「Vera Rubin NVL72」が登場予定。Mixture-of-Experts(MoE)推論ではBlackwellと比べて1メガワットあたり10倍のスループットを達成し、1トークンあたりのコストは10分の1に。大規模モデルの学習にも、Blackwell比でGPU数を4分の1に削減できる見込み。 NVIDIAは、ハードウェアとソフトウェアの極限的コードデザインにより、AIのスケーラビリティと経済性を飛躍的に向上させ、エージェント型AIの実用化を加速している。

関連リンク

NVIDIA Blackwell Ultra、エージェント型AIで最大50倍の性能向上と35倍のコスト削減を実現 | 人気の記事 | HyperAI超神経