HyperAIHyperAI

Command Palette

Search for a command to run...

エージェント連鎖:マルチエージェント蒸留とエージェント型RLによるエンドツーエンドエージェント基盤モデル

概要

大規模言語モデル(LLM)およびマルチエージェントシステムの最近の進展により、深層研究、ビーブコーディング、数学的推論など、複雑な問題解決タスクにおいて顕著な能力が示されている。しかし、現存する大多数のマルチエージェントシステムは、高度なエージェントフレームワークを用いた手動によるプロンプト/ワークフロー設計に基づいて構築されており、計算効率が低く、能力も限られている上、データ中心の学習の恩恵を受けることができない。本研究では、マルチエージェントシステムと同様の方法(複数のツールおよび複数のエージェントを用いた複数ターンの問題解決)で、一貫したエンド・トゥ・エンドの複雑な問題解決をモデル内にネイティブに実現する、新しいLLM推論パラダイム「エージェントの連鎖(Chain-of-Agents, CoA)」を提案する。CoAによる問題解決では、モデルが動的に異なるツールエージェントや役割遂行エージェントを活性化し、エンド・トゥ・エンドの形でマルチエージェント協働を模倣する。LLMにエンド・トゥ・エンドのCoA問題解決能力を引き出すために、最先端のマルチエージェントシステムを「エージェントの連鎖」軌道に蒸留するマルチエージェント蒸留フレームワークを導入し、エージェント指向の教師あり微調整(supervised fine-tuning)に活用する。さらに、検証可能なエージェントタスク上でエージェント指向強化学習(agentic reinforcement learning)を適用することで、CoA問題解決におけるモデルの能力をさらに向上させる。このようにして得られたモデルを「エージェント基盤モデル(Agent Foundation Models, AFMs)」と呼ぶ。実験的な評価結果から、AFMはウェブエージェントおよびコードエージェントの両設定において、多様なベンチマークで新たな最優秀性能を達成することが明らかになった。本研究で開発したすべての成果——モデル重み、学習および評価用コード、学習データ——を完全にオープンソース化しており、今後のエージェントモデルおよびエージェント指向強化学習に関する研究に堅実な出発点を提供する。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
エージェント連鎖:マルチエージェント蒸留とエージェント型RLによるエンドツーエンドエージェント基盤モデル | 記事 | HyperAI超神経