Command Palette

Search for a command to run...

2 个月前

通过环境扩展迈向通用Agent智能

通过环境扩展迈向通用Agent智能

摘要

先进的代理智能是将大型语言模型应用于实际、现实世界场景的先决条件。现实世界中多样化的API对函数调用能力提出了精确且稳健的要求,而这种能力需要通过代理在多样化环境中的交互来逐步构建。代理在函数调用方面的综合能力与其训练所处环境的多样性密切相关。在本研究中,我们通过扩展训练环境来推动通用代理智能的发展。这一过程引出两个核心挑战:(i)如何以系统化的方式实现环境的规模化;(ii)如何有效利用与这些环境交互所获得的经验来训练代理能力。为应对上述挑战,我们设计了一套可扩展的框架,能够自动构建完全模拟的异构环境,系统性地拓展函数调用场景的覆盖范围。此外,我们进一步采用两阶段的代理微调策略:首先赋予代理基础的代理能力,随后针对特定领域场景进行专业化优化。在多个代理基准测试(tau-bench、tau2-Bench 和 ACEBench)上的大量实验表明,我们训练得到的模型 AgentScaler 显著提升了模型的函数调用能力。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供