
要約
言語エージェントがますます複雑なタスクに取り組む中で、効果的な誤り訂正とドメイン間での経験の再利用に苦戦しています。本稿では、階層的な経験フレームワークであるAgent KBを紹介します。このフレームワークは、新しいReason-Retrieve-Refineパイプラインを用いて複雑なエージェントによる問題解決を可能にします。Agent KBは、エージェントが伝統的に互いの経験から学ぶことができないという核心的な制約に対処します。高レベルの戦略と詳細な実行ログの両方を捉えることで、Agent KBは共有知識ベースを作成し、エージェント間での知識転送を可能にします。GAIAベンチマークにおいて評価された結果、Agent KBは最大16.28パーセンテージポイントの成功率向上を達成しました。最も困難なタスクでは、Claude-3の成功率が38.46%から57.69%へと向上し、中程度の難易度のタスクではGPT-4が53.49%から73.26%へと改善しました。SWE-benchコード修復においても、Agent KBによりClaude-3の成功率は41.33%から53.33%へと上昇しました。これらの結果は、Agent KBが過去の経験から学習し、成功した戦略を新しいタスクに一般化するためのモジュール型でフレームワーク非依存的な基盤を提供していることを示唆しています。