HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA が AI-Q で DeepResearch ベンチ 1 位を達成

NVIDIA の AI-Q が、深層研究エージェントの評価において主要なベンチマークである DeepResearch Bench と DeepResearch Bench II で両方とも 1 位を獲得しました。この成果は、55.95 および 54.50 のスコアを記録し、オープンでポータブルな深層研究の重要な一歩を示しています。AI-Q は、エンタープライズおよびウェブデータを推論し、信頼性の高い引用付きレポートを生成するための完全なオープンかつモジュラーなブループリントです。 同システムは、NVIDIA NeMo エージェントツールキットおよびファインチューニングされた NVIDIA Nemotron 3 Super モデルを基盤としており、計画者、研究者、調整役という 3 つのエージェントで構成されるマルチエージェントアーキテクチャを採用しています。調整役が研究ループを統括し、計画者が情報をマッピングして根拠のある計画を作成します。その後、研究者が複数の専門サブエージェントを並行して起動し、異なる分析視点から証拠を収集・合成します。この設計により、調整役のコンテキストウィンドウがノイズに埋もれるのを防ぎ、効率的な推論を可能にしています。 勝利の鍵となった要素は、複数段階の研究プロセス(計画→収集→合成)と、Tavily や Serper を利用したウェブ・学術検索の統合です。さらに、信頼性を高めるために、NVIDIA のファインチューニングを施した Nemotron 3 モデルが使用され、約 67k のトレーニング軌道データが活用されました。長期実行時の障害を回避するための独自ミドルウェアや、複数のパイプライン出力を統合するアンサンブル機能、レポートの質を高めるための後処理リファイナーなどのオプションも、柔軟な構成で提供されています。YAML 設定により、各コンポーネントに異なる大規模言語モデル(LLM)やツールを自由に組み換えることが可能です。 このアーキテクチャは、ブラックボックス化されることなく、企業が所有・監査・カスタマイズできる点に強みがあります。単一の技術スタックで最先端の性能を達成しつつ、透明性と制御を損なわない成果を示しました。NVIDIA は 2026 年 3 月 16 日からサンホゼで開催される GTC で、さらに詳細な情報を公開する予定です。

関連リンク

NVIDIA が AI-Q で DeepResearch ベンチ 1 位を達成 | 人気の記事 | HyperAI超神経