Command Palette
Search for a command to run...

摘要
实践学习范式对于构建具备能力的智能体(Agentic)AI系统至关重要,然而其发展受到经验生成效率低下的严重制约,这一瓶颈在GAIA等复杂基准测试中尤为突出。为应对这一挑战,我们提出了AWorld——一个专为大规模智能体-环境交互设计的开源系统。通过将任务分布到集群中执行,AWorld相较传统的单节点顺序执行方式,将经验收集速度提升了14.6倍。这一关键性加速使得大规模强化学习成为可行且可扩展的实践。基于该能力,我们训练了一个基于Qwen3-32B的智能体,其性能显著优于基础模型,整体GAIA准确率从21.59%提升至32.23%。在该基准测试中最具挑战性的层级上,我们的智能体取得了16.33%的成绩,超越了当前领先的专有模型表现。我们开源的系统及其训练所得的智能体,为构建完整的智能体AI训练流水线提供了切实可行的蓝图,实现了从高效交互到可验证模型性能提升的全流程闭环。