HyperAI
Command Palette
Search for a command to run...
Open-RL 推理问题数据集
Open-RL 是由 Turing 于 2026 年发布的多领域推理问题数据集,包含物理学、数学、生物学和化学的独立、可验证和明确的 STEM 推理问题。每个问题需要多步推理,涉及符号操作和/或数值计算,且具有可客观验证的最终答案。该数据集适合用于强化学习微调、奖励建模、结果监督训练以及可验证推理基准测试。每个问题需要多步推理,并涉及符号操作和数值计算,具有可验证的最终答案。
数据字段:
- conversation_id: 每个问答对的唯一标识符
- domain: 所属领域(物理学、数学、化学、生物学)
- sub_domain: 具体学科
- question: 支持 LaTeX 的 STEM 问题描述
- answer: 确定性的标准答案
该数据集由社区用户贡献,仅供交流学习使用。如内容涉及侵权,请联系邮箱 [email protected] 以便及时审查和下架。