Command Palette

Search for a command to run...

2ヶ月前

WebResearcher:長期にわたるエージェントにおける無制限の推論能力の発揮

WebResearcher:長期にわたるエージェントにおける無制限の推論能力の発揮

要約

最近の深層調査システムにおける進展により、AIエージェントが外部情報源から自律的に知識を発見・統合する可能性が示された。本論文では、このようなエージェントを構築するための新しいフレームワーク「WebResearcher」を紹介する。本フレームワークは以下の2つの鍵となる構成要素からなる:(1) WebResearcher 本体は、反復的な深層調査の枠組みを提供する。この枠組みは、深層調査をマルコフ決定過程(Markov Decision Process)として再定式化し、エージェントが定期的に得られた知見を進化するレポートに統合しつつ、焦点を絞った作業空間を維持することで、従来の単一文脈アプローチに見られる「文脈の枯渇(context suffocation)」および「ノイズの混入(noise contamination)」という課題を克服する。また、(2) WebFrontier は、ツール拡張による複雑性の段階的増大(tool-augmented complexity escalation)を用いて高品質な学習データを生成するスケーラブルなデータ統合エンジンであり、受動的な知識想起から能動的な知識構築へとつながる研究課題を体系的に創出することを可能にする。特に、本研究では、本フレームワークから得られる学習データが、従来の単一文脈型手法に対しても、ツール利用能力を顕著に向上させることを発見した。さらに、本アプローチは並列的思考(parallel thinking)によって自然にスケーラブルであり、複数エージェントが同時に探索を実行することで、より包括的な結論の導出を実現する。6つの困難なベンチマークにおける広範な実験の結果、WebResearcherは最先端の性能を達成しており、一部の最先端プロプライエタリシステムをも上回ることを示した。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています