DeepResearch Bench 深度研究基准数据集
DeepResearch Bench 是由中国科学技术大学于 2025 年发布的一个深度研究代理基准数据集,相关论文成果为:「DeepResearch Bench: A Comprehensive Benchmark for Deep Research Agents」,旨在揭示人类在不同领域的深度研究需求的真实分布。
该数据集包含 100 个博士级研究任务,每个任务均由 22 个不同领域的专家精心打造,其中包括:
- 科学与技术:物理、化学、生物、环境科学与工程
- 金融与商业:投资、个人理财、市场营销和人力资源
- 软件:与软件使用和互联网相关的主题
- 其他:艺术与设计、娱乐、历史、工业、交通、旅游等