HyperAI超神经

SynLogic 推理数据集

日期

5 days ago

机构

发布地址

huggingface.co

分类

下载帮助

SynLogic 是由香港科技大学联合 MiniMax 的研究团队,于 2025 年发布的一个全面的合成逻辑推理数据集,相关论文成果为:「SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond」,旨在通过具有可验证奖励的强化学习来增强大型语言模型(LLMs)的逻辑推理能力。

该数据集包含 35 种多样化的逻辑推理任务,并具有自动验证功能,使其非常适合进行强化学习训练。

主要特点

  • 35 种任务类型:包括数独、 24 点游戏、密码、箭头迷宫、算术谜题等
  • 可验证的奖励:所有样本都具有用于正确性检查的自动验证器
  • 可控难度:每个任务都有可调节的难度参数
  • 两个版本:简易版(针对 7B 模型)和困难版(针对 32B 模型)

数据集配置

SynLogic-Easy

  • 目标:7B 参数模型
  • 任务:27 个任务
  • 样本:约 16,000 个训练实例

SynLogic-Hard

  • 目标:32B 参数模型
  • 任务:全部 35 项任务
  • 样本:约 33,000 个训练实例