NVIDIA、NeMo Retriever を発表し汎用エージェントの検索を実現
NVIDIA の NeMo Retriever チームは、新たに開発したインテリジェント検索パイプラインが「ViDoRe v3」ランキングで第 1 位を獲得し、難易度の高い「BIGHT」推論ランキングでは第 2 位に入賞したと発表した。この結果は、同ソリューションの汎用性と適応性の顕著な優位性を証明するものとなった。 従来の検索手法は主に意味的な類似度に基づいているため、複雑なドキュメントや深層推論を扱う際には限界を示すことが多い。これを克服するため、NeMo チームは ReACT アーキテクチャに基づくエージェント型検索パイプラインを構築した。本パイプラインは大規模言語モデルと検索エンジンの間の動的相互作用ループを通じて、単一のクエリに依存せず、自律的に計画を立てて反復的に検索を行い、その結果を評価する。また、エージェントがステップ制限に直面した場合、システムは自動的に相互順位融合(RRF)メカニズムへ切り替えてセーフティネットとし、タスクの完遂を保証する。 実装面において、チームは従来のモデル・コンテキスト・プロトコル(MCP)サーバーアーキテクチャを見直し、スレッドセーフなシングルトン型の検索エンジンを採用した。これによりネットワーク転送遅延やプロセス設定の複雑さが解消され、GPU 利用率と実験のスループットが大幅に向上。高性能なエージェント検索が大規模ベンチマークテストでも効率的に実行可能になった。 試験データによると、本パイプラインは極めて優れた一般化能力を発揮している。複雑な視覚レイアウトに焦点を当てた ViDoRe v3 タスクでは、NeMo は NDCG@10 スコア 69.22 で競合他社を上回り、一方、他の分野における同一データセットでの競合社のパフォーマンスには明確な低下が見られた。エージェント検索の 1 クエリあたりの処理時間(約 136 秒)およびコストは伝統的な密着検索よりも高額であるものの、複雑なロジックや視覚的理解が必要なタスクにおいては代替不可能な性能を示している。 NVIDIA は今後の最適化重点課題として、蒸留技術を用いて高度な推論パターンをより小型のオープンソースモデルに移行させ、遅延とコストを削減することを掲げている。現時点で該モジュールは柔軟な構成が可能であり、開発者は異なる大規模言語モデルと NVIDIA の商用埋め込みモデルを組み合わせて、企業のニーズに適した高汎用的な検索ワークフローを構築できる。
