HyperAI超神経

3ヶ月前

NVIDIAの最新AIプラットフォーム「Blackwell Ultra」が、エージェント型AI（agentic AI）のパフォーマンスと経済性において顕著な進化を実現した。新データによると、Blackwell Ultraを搭載したGB300 NVL72システムは、従来のHopperプラットフォームと比べて、1メガワットあたりの処理量が最大50倍向上し、1トークンあたりのコストは最大35倍低減された。特に、複数ステップの作業やリアルタイム対応が求められるエージェント型AIやコードアシスタントに最適な低遅延・長文脈処理において、大きな効果が発揮されている。 Agentic AIの需要は急増しており、OpenRouterの調査では、ソフトウェア開発関連のAIクエリが1年前の11％から約50％にまで拡大。このようなワークロードは、コードベース全体を理解するための長文脈処理と、リアルタイムでの応答性を両立する必要がある。Blackwell Ultraは、次世代GPUとNVIDIAのソフトウェア最適化技術（TensorRT-LLM、Dynamo、Mooncake、SGLang）を統合し、低遅延と長文脈処理の両面で画期的な性能を実現。GB300 NVL72は、128,000トークンの入力と8,000トークンの出力に対応する長文脈処理でも、GB200 NVL72と比べて最大1.5倍のコスト削減を実現した。 Microsoft、CoreWeave、OCIなどの主要クラウドプロバイダーがGB300 NVL72を本格的に導入。特にCoreWeaveのエンジニアリング上級副社長Chen Goldberg氏は、「インフェンスがAIの中心に移行する中、トークン効率と長文脈性能が不可欠。GB300はその課題を直接解決し、顧客に予測可能なパフォーマンスとコスト効率を提供する」と評価した。さらに、将来の次世代プラットフォームとして「Vera Rubin NVL72」が登場予定。Mixture-of-Experts（MoE）推論ではBlackwellと比べて1メガワットあたり10倍のスループットを達成し、1トークンあたりのコストは10分の1に。大規模モデルの学習にも、Blackwell比でGPU数を4分の1に削減できる見込み。 NVIDIAは、ハードウェアとソフトウェアの極限的コードデザインにより、AIのスケーラビリティと経済性を飛躍的に向上させ、エージェント型AIの実用化を加速している。

このニュースは、業界の最新情報を効率的に提供するため、AIによって自動的に集約されています。内容は意見や助言を構成するものではありません。

関連リンク

関連リンク

関連リンク

CVEvolveは、アルゴンヌ国立研究所が提案した、コード不要で自己発見型の科学画像処理アルゴリズムであり、コーディング、結果の自己検証、戦略最適化など、フルスタックの機能を備えている。

CVEvolveは、アルゴンヌ国立研究所が提案した、コード不要で自己発見型の科学画像処理アルゴリズムであり、コーディング、結果の自己検証、戦略最適化など、フルスタックの機能を備えている。

Command Palette

NVIDIA Blackwell Ultra、エージェント型AIで最大50倍の性能向上と35倍のコスト削減を実現

関連リンク

Command Palette

NVIDIA Blackwell Ultra、エージェント型AIで最大50倍の性能向上と35倍のコスト削減を実現

関連リンク

Command Palette

NVIDIA Blackwell Ultra、エージェント型AIで最大50倍の性能向上と35倍のコスト削減を実現

関連リンク

CVEvolveは、アルゴンヌ国立研究所が提案した、コード不要で自己発見型の科学画像処理アルゴリズムであり、コーディング、結果の自己検証、戦略最適化など、フルスタックの機能を備えている。

CVEvolveは、アルゴンヌ国立研究所が提案した、コード不要で自己発見型の科学画像処理アルゴリズムであり、コーディング、結果の自己検証、戦略最適化など、フルスタックの機能を備えている。