HyperAI
Command Palette
Search for a command to run...
SynLogic 推理数据集
SynLogic 是由香港科技大学联合 MiniMax 的研究团队,于 2025 年发布的一个全面的合成逻辑推理数据集,相关论文成果为:「SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond」,旨在通过具有可验证奖励的强化学习来增强大型语言模型(LLMs)的逻辑推理能力。 该数据集包含 35 种多样化的逻辑推理任务,并具有自动验证功能,使其非常适合进行强化学习训练。
主要特点
- 35 种任务类型:包括数独、 24 点游戏、密码、箭头迷宫、算术谜题等
- 可验证的奖励:所有样本都具有用于正确性检查的自动验证器
- 可控难度:每个任务都有可调节的难度参数
- 两个版本:简易版(针对 7B 模型)和困难版(针对 32B 模型)
数据集配置
SynLogic-Easy
- 目标:7B 参数模型
- 任务:27 个任务
- 样本:约 16,000 个训练实例 SynLogic-Hard
- 目标:32B 参数模型
- 任务:全部 35 项任务
- 样本:约 33,000 个训练实例
Citation
@misc{liu2025synlogic,
title={SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond},
author={Junteng Liu and Yuanxiang Fan and Zhuo Jiang and Han Ding and Yongyi Hu and Chi Zhang and Yiqi Shi and Shitong Weng and Aili Chen and Shiqi Chen and Yunan Huang and Mozhi Zhang and Pengyu Zhao and Junjie Yan and Junxian He},
year={2025},
eprint={2505.19641},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2505.19641},
}
SynLogic.torrent
做种 1正在下载 0已完成 104总下载量 241
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。