SynLogic 推理数据集
SynLogic 是由香港科技大学联合 MiniMax 的研究团队,于 2025 年发布的一个全面的合成逻辑推理数据集,相关论文成果为:「SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond」,旨在通过具有可验证奖励的强化学习来增强大型语言模型(LLMs)的逻辑推理能力。
该数据集包含 35 种多样化的逻辑推理任务,并具有自动验证功能,使其非常适合进行强化学习训练。
主要特点
- 35 种任务类型:包括数独、 24 点游戏、密码、箭头迷宫、算术谜题等
- 可验证的奖励:所有样本都具有用于正确性检查的自动验证器
- 可控难度:每个任务都有可调节的难度参数
- 两个版本:简易版(针对 7B 模型)和困难版(针对 32B 模型)
数据集配置
- 目标:7B 参数模型
- 任务:27 个任务
- 样本:约 16,000 个训练实例
- 目标:32B 参数模型
- 任务:全部 35 项任务
- 样本:约 33,000 个训练实例