Command Palette

Search for a command to run...

6 天前

通义DeepResearch技术报告

通义DeepResearch技术报告

摘要

我们提出 Tongyi DeepResearch,这是一个专为长周期、深度信息探索型研究任务设计的智能体式大语言模型。为激励自主深度研究能力,Tongyi DeepResearch 采用端到端的训练框架,融合智能体式中期训练与智能体式后期训练,从而在复杂任务中实现可扩展的推理与信息检索能力。我们设计了一条高度可扩展的数据合成流水线,完全自动化,无需依赖昂贵的人工标注,全面赋能各个训练阶段。通过为每个阶段构建定制化环境,我们的系统实现了全程稳定且一致的交互体验。Tongyi DeepResearch 拥有总计 305 亿参数,每 token 仅激活 33 亿参数,已在多项智能体式深度研究基准测试中达到当前最优性能,涵盖 Humanity's Last Exam、BrowseComp、BrowseComp-ZH、WebWalkerQA、xbench-DeepSearch、FRAMES 以及 xbench-DeepSearch-2510。我们已开源该模型、训练框架及完整解决方案,以赋能全球研究社区。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供