Command Palette

Search for a command to run...

2 个月前

输入重构如何提升复杂动态环境中工具使用准确性?基于τ-bench 的研究

Venkatesh Mishra Amir Saeidi Satyam Raj Mutsumi Nakamura Jayanth Srinivasa Gaowen Liu Ali Payani Chitta Baral

输入重构如何提升复杂动态环境中工具使用准确性?基于τ-bench 的研究

摘要

大型语言模型(LLMs)在推理与规划能力方面的最新进展,使其具备了作为自主智能体在动态环境中使用工具的潜力。然而,在如 $τ$-bench 这类多轮对话环境中,这些智能体往往在长期工具调用与对话过程中,面临推理不一致、难以遵循领域特定规则以及正确提取信息等挑战。为捕捉并缓解这些失败模式,我们对对话轨迹中常见的错误进行了全面的手动分析,并尝试通过重构输入来提升工具调用智能体的决策能力。最终,我们提出了输入重构多智能体(Input-Reformulation Multi-Agent, IRMA)框架,该框架能够自动将用户查询与相关领域规则及工具建议相结合,进行重构后输入给工具调用智能体,使其能够更聚焦于关键任务。实验结果表明,IRMA 在整体 pass^5 得分上分别比 ReAct、函数调用(Function Calling)和自我反思(Self-Reflection)方法提升了 16.1%、12.7% 和 19.1%。这些结果表明,在动态环境中,IRMA 相较于其他方法展现出更优的可靠性与一致性。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供