12 天前

认知内核-Pro:面向深度研究Agent与Agent基础模型训练的框架

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu
认知内核-Pro:面向深度研究Agent与Agent基础模型训练的框架
摘要

通用人工智能代理(General AI Agents)正日益被视为下一代人工智能的基石性框架,能够实现复杂推理、网络交互、编程以及自主研究等能力。然而,当前的代理系统要么为闭源,要么严重依赖多种付费API和专有工具,限制了研究社区的可访问性与结果可复现性。在本研究中,我们提出Cognitive Kernel-Pro——一个完全开源且在最大程度上免费的多模块智能代理框架,旨在推动先进人工智能代理的开发与评估的民主化。在 Cognitive Kernel-Pro 框架中,我们系统性地研究了面向代理基础模型(Agent Foundation Models)的高质量训练数据构建方法,重点聚焦于四个关键领域:网络交互、文件操作、代码生成与通用推理,分别构建高质量的查询(queries)、行为轨迹(trajectories)以及可验证的答案(verifiable answers)。此外,我们还探索了新型的代理运行时反思(test-time reflection)与投票机制,以提升代理系统的鲁棒性与整体性能。我们在 GAIA 基准上对 Cognitive Kernel-Pro 进行了评估,结果在开源且免费的代理系统中达到当前最优水平。值得注意的是,我们提出的 8B 参数量级开源模型,已超越此前领先的系统如 WebDancer 和 WebSailor,为可获取、高性能的人工智能代理树立了新的性能标杆。代码已开源,地址为:https://github.com/Tencent/CognitiveKernel-Pro