Command Palette
Search for a command to run...

摘要
先进的代理智能是将大型语言模型应用于实际、现实世界场景的先决条件。现实世界中多样化的API对函数调用能力提出了精确且稳健的要求,而这种能力需要通过代理在多样化环境中的交互来逐步构建。代理在函数调用方面的综合能力与其训练所处环境的多样性密切相关。在本研究中,我们通过扩展训练环境来推动通用代理智能的发展。这一过程引出两个核心挑战:(i)如何以系统化的方式实现环境的规模化;(ii)如何有效利用与这些环境交互所获得的经验来训练代理能力。为应对上述挑战,我们设计了一套可扩展的框架,能够自动构建完全模拟的异构环境,系统性地拓展函数调用场景的覆盖范围。此外,我们进一步采用两阶段的代理微调策略:首先赋予代理基础的代理能力,随后针对特定领域场景进行专业化优化。在多个代理基准测试(tau-bench、tau2-Bench 和 ACEBench)上的大量实验表明,我们训练得到的模型 AgentScaler 显著提升了模型的函数调用能力。