5 个月前

Runnan Fang Shihao Cai Baixuan Li Jialong Wu Guangyu Li Wenbiao Yin Xinyu Wang Xiaobin Wang Liangcai Su Zhen Zhang

摘要

先进的代理智能是将大型语言模型应用于实际、现实世界场景的先决条件。现实世界中多样化的API对函数调用能力提出了精确且稳健的要求，而这种能力需要通过代理在多样化环境中的交互来逐步构建。代理在函数调用方面的综合能力与其训练所处环境的多样性密切相关。在本研究中，我们通过扩展训练环境来推动通用代理智能的发展。这一过程引出两个核心挑战：（i）如何以系统化的方式实现环境的规模化；（ii）如何有效利用与这些环境交互所获得的经验来训练代理能力。为应对上述挑战，我们设计了一套可扩展的框架，能够自动构建完全模拟的异构环境，系统性地拓展函数调用场景的覆盖范围。此外，我们进一步采用两阶段的代理微调策略：首先赋予代理基础的代理能力，随后针对特定领域场景进行专业化优化。在多个代理基准测试（tau-bench、tau2-Bench 和 ACEBench）上的大量实验表明，我们训练得到的模型 AgentScaler 显著提升了模型的函数调用能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

5 个月前

Runnan Fang Shihao Cai Baixuan Li Jialong Wu Guangyu Li Wenbiao Yin Xinyu Wang Xiaobin Wang Liangcai Su Zhen Zhang

摘要

先进的代理智能是将大型语言模型应用于实际、现实世界场景的先决条件。现实世界中多样化的API对函数调用能力提出了精确且稳健的要求，而这种能力需要通过代理在多样化环境中的交互来逐步构建。代理在函数调用方面的综合能力与其训练所处环境的多样性密切相关。在本研究中，我们通过扩展训练环境来推动通用代理智能的发展。这一过程引出两个核心挑战：（i）如何以系统化的方式实现环境的规模化；（ii）如何有效利用与这些环境交互所获得的经验来训练代理能力。为应对上述挑战，我们设计了一套可扩展的框架，能够自动构建完全模拟的异构环境，系统性地拓展函数调用场景的覆盖范围。此外，我们进一步采用两阶段的代理微调策略：首先赋予代理基础的代理能力，随后针对特定领域场景进行专业化优化。在多个代理基准测试（tau-bench、tau2-Bench 和 ACEBench）上的大量实验表明，我们训练得到的模型 AgentScaler 显著提升了模型的函数调用能力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供