HyperAIHyperAI

Command Palette

Search for a command to run...

Open-RL 推理问题数据集

日期

5 小时前

许可证

MIT

Open-RL 是由 Turing 于 2026 年发布的多领域推理问题数据集,包含物理学、数学、生物学和化学的独立、可验证和明确的 STEM 推理问题。每个问题需要多步推理,涉及符号操作和/或数值计算,且具有可客观验证的最终答案。该数据集适合用于强化学习微调、奖励建模、结果监督训练以及可验证推理基准测试。每个问题需要多步推理,并涉及符号操作和数值计算,具有可验证的最终答案。

数据字段:

  • conversation_id: 每个问答对的唯一标识符
  • domain: 所属领域(物理学、数学、化学、生物学)
  • sub_domain: 具体学科
  • question: 支持 LaTeX 的 STEM 问题描述
  • answer: 确定性的标准答案

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供