HyperAI

AIのパフォーマンス向上において、ソフトウェアの進化がハードウェアをはるかに上回る影響力を持つことが、NVIDIAの最新動向から明らかになった。2025年3月のGTCで、同社CEOの黄仁勲氏は、AI推論のスループットと応答時間のトレードオフを示す「パレート前線」曲線を用いて、性能の限界を可視化した。この曲線は、複数の変数（GPU数、並列化方式、精度など）を調整することで、最適な性能バランスを示す。 H200 GPUを搭載した8ノード構成のシステムと、B200 GPUを72基使用するラックスケール構成のBlackwellシステムを比較した結果、ソフトウェア最適化（Dynamo、TensorRT）と精度の低下（FP4）を組み合わせることで、エネルギー当たりのスループットは最大25倍（実測では約31倍）向上。特に、推論モデル（例：GPT-OSS、DeepSeek R1）では、密度型モデルと比べてエネルギー効率が11倍悪化するが、ユーザーあたりの応答速度はほぼ同等に保たれ、B200の性能優位性は40倍に達した。 NVIDIAは、SemiAnalysisのInferenceMax v1ベンチマークで、GPT-OSS 120B、DeepSeek R1-0528、Llama 3.3 70B Instructの3モデルを対象に、ソフトウェア最適化の急速な進化を実証。8月から9月にかけて、パレート前線がほぼ2倍に拡大。その後、10月3日にはNVSwitchのデータアクセス並列化、10月9日には「マルチトークン予測（推測実行）」の導入により、最大ユーザー応答速度が1,000トークン/秒/ユーザーに達し、100 TPS付近のスループットは5倍に。従来、ソフトウェアによる性能向上は2年を要したが、AI推論の分野では数週間で実現可能に。これは、ソフトウェアがハードウェアの進化を上回るスピードでパフォーマンスを押し上げている証拠。NVIDIAの社内では、20％の従業員がハードウェア、80％がソフトウェアに従事し、全体の60％の性能向上をソフトウェアが担っている。このように、AIの進化は「ハードウェアの進化」ではなく、「ソフトウェアの最適化」によって大きく動いている。最新の技術動向をリアルタイムで把握し、ソフトウェアを継続的にチューニングすることが、企業の競争力に直結する時代が到来している。

関連リンク

関連リンク

関連リンク

ケンブリッジ大学などは、地球観測ミッションのためのピクセルレベルの基本モデルを提案し、複数のミッションで最先端の精度（SOTA）を達成した。

ケンブリッジ大学などは、地球観測ミッションのためのピクセルレベルの基本モデルを提案し、複数のミッションで最先端の精度（SOTA）を達成した。

Command Palette

ソフトウェア最適化がAIパレート前線を「25倍」押し広げる——NVIDIA、数週間で性能を急上昇

関連リンク

Command Palette

ソフトウェア最適化がAIパレート前線を「25倍」押し広げる——NVIDIA、数週間で性能を急上昇

関連リンク

Command Palette

ソフトウェア最適化がAIパレート前線を「25倍」押し広げる——NVIDIA、数週間で性能を急上昇

関連リンク

ケンブリッジ大学などは、地球観測ミッションのためのピクセルレベルの基本モデルを提案し、複数のミッションで最先端の精度（SOTA）を達成した。

ケンブリッジ大学などは、地球観測ミッションのためのピクセルレベルの基本モデルを提案し、複数のミッションで最先端の精度（SOTA）を達成した。