
摘要
随着语言代理处理日益复杂的任务,它们在有效错误纠正和跨领域经验复用方面遇到了挑战。我们引入了Agent KB,这是一种分层经验框架,通过一种新颖的“推理-检索-精炼”(Reason-Retrieve-Refine)管道实现了复杂的代理问题解决。Agent KB 解决了一个核心限制:传统上,代理无法从彼此的经验中学习。通过记录高层次策略和详细的执行日志,Agent KB 创建了一个共享知识库,支持跨代理的知识转移。在GAIA基准测试中评估的结果显示,Agent KB 将成功率提高了多达16.28个百分点。对于最具挑战性的任务,Claude-3的成功率从38.46%提高到57.69%,而GPT-4在中级任务上的成功率则从53.49%提高到73.26%。在SWE-bench代码修复任务中,Agent KB 使 Claude-3 的成功率从41.33%提升至53.33%。我们的研究结果表明,Agent KB 提供了一种模块化且不受框架限制的基础设施,使代理能够从过去的经验中学习,并将成功的策略推广到新任务中。