HyperAIHyperAI

Command Palette

Search for a command to run...

CHIMERA 通用推理合成数据集

日期

3 小时前

论文 URL

2603.00889

许可证

Apache 2.0

CHIMERA 是一个专为推理训练设计的合成推理数据集,相关论文成果为 CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning 。该数据集涵盖广泛的 STEM 学科,并提供长链思维(CoT)轨迹。

该数据集包含 9,225 个问题,8 个学科(数学、计算机科学、化学、物理、文学、历史、生物学、语音学),所有示例均由大型语言模型(LLM)生成,并通过自动验证,无需人工标注。

学科分布:

  • 数学:4,452
  • 计算机科学:1,303
  • 化学:1,102
  • 物理:742
  • 文学:504
  • 历史:422
  • 生物学:383
  • 语言学:317

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供