HyperAI
Command Palette
Search for a command to run...
CHIMERA 通用推理合成数据集
CHIMERA 是一个专为推理训练设计的合成推理数据集,相关论文成果为 CHIMERA: Compact Synthetic Data for Generalizable LLM Reasoning 。该数据集涵盖广泛的 STEM 学科,并提供长链思维(CoT)轨迹。
该数据集包含 9,225 个问题,8 个学科(数学、计算机科学、化学、物理、文学、历史、生物学、语音学),所有示例均由大型语言模型(LLM)生成,并通过自动验证,无需人工标注。
学科分布:
- 数学:4,452
- 计算机科学:1,303
- 化学:1,102
- 物理:742
- 文学:504
- 历史:422
- 生物学:383
- 语言学:317
该数据集由社区用户贡献,仅供交流学习使用。如内容涉及侵权,请联系邮箱 [email protected] 以便及时审查和下架。