日期

8 个月前

大小

50.49 MB

数据集组织

论文 URL

标签

SynLogic 是由香港科技大学联合 MiniMax 的研究团队，于 2025 年发布的一个全面的合成逻辑推理数据集，相关论文成果为：「SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond」，旨在通过具有可验证奖励的强化学习来增强大型语言模型（LLMs）的逻辑推理能力。

该数据集包含 35 种多样化的逻辑推理任务，并具有自动验证功能，使其非常适合进行强化学习训练。

主要特点

35 种任务类型：包括数独、 24 点游戏、密码、箭头迷宫、算术谜题等
可验证的奖励：所有样本都具有用于正确性检查的自动验证器
可控难度：每个任务都有可调节的难度参数
两个版本：简易版（针对 7B 模型）和困难版（针对 32B 模型）

数据集配置

SynLogic-Easy

目标：7B 参数模型
任务：27 个任务
样本：约 16,000 个训练实例

SynLogic-Hard

目标：32B 参数模型
任务：全部 35 项任务
样本：约 33,000 个训练实例

SynLogic.torrent

做种 1正在下载 0已完成 60总下载量 169

SynLogic/
- README.md
  1.79 KB
- README.txt
  3.58 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

下载

在 Discord 上讨论

日期

8 个月前

大小

50.49 MB

数据集组织

论文 URL

标签

该数据集包含 35 种多样化的逻辑推理任务，并具有自动验证功能，使其非常适合进行强化学习训练。

主要特点

35 种任务类型：包括数独、 24 点游戏、密码、箭头迷宫、算术谜题等
可验证的奖励：所有样本都具有用于正确性检查的自动验证器
可控难度：每个任务都有可调节的难度参数
两个版本：简易版（针对 7B 模型）和困难版（针对 32B 模型）

数据集配置

SynLogic-Easy

目标：7B 参数模型
任务：27 个任务
样本：约 16,000 个训练实例

SynLogic-Hard

目标：32B 参数模型
任务：全部 35 项任务
样本：约 33,000 个训练实例

SynLogic.torrent

做种 1正在下载 0已完成 60总下载量 169

SynLogic/
- README.md
  1.79 KB
- README.txt
  3.58 KB

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

VERA 语音推理评测数据集

3 个月前

2.37 GB59

TxT360-3efforts 多任务推理数据集

1 个月前

RoVid-X 机器人视频生成数据集

5 天前

Nemotron-Math-v2 数学推理数据集

25 天前

MUVR 多模态非裁剪视频检索基准

2 个月前

HumanSense Benchmark 人体感知基准数据集

3 个月前

FrontierScience 推理科研任务评测数据集

2 个月前

Envision 多阶段事件视觉生成数据集

2 个月前

Med-Banana-50K 医学影像编辑数据集

1 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

SynLogic 推理数据集

主要特点

数据集配置

用 AI 构建 AI

HyperAI Newsletters

Command Palette

SynLogic 推理数据集

主要特点

数据集配置

相关数据集

VERA 语音推理评测数据集

TxT360-3efforts 多任务推理数据集

RoVid-X 机器人视频生成数据集

Nemotron-Math-v2 数学推理数据集

MUVR 多模态非裁剪视频检索基准

HumanSense Benchmark 人体感知基准数据集

FrontierScience 推理科研任务评测数据集

Envision 多阶段事件视觉生成数据集

Med-Banana-50K 医学影像编辑数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

SynLogic 推理数据集

主要特点

数据集配置

相关数据集

VERA 语音推理评测数据集

TxT360-3efforts 多任务推理数据集

RoVid-X 机器人视频生成数据集

Nemotron-Math-v2 数学推理数据集

MUVR 多模态非裁剪视频检索基准

HumanSense Benchmark 人体感知基准数据集

FrontierScience 推理科研任务评测数据集

Envision 多阶段事件视觉生成数据集

Med-Banana-50K 医学影像编辑数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

VERA 语音推理评测数据集

TxT360-3efforts 多任务推理数据集

RoVid-X 机器人视频生成数据集

Nemotron-Math-v2 数学推理数据集

MUVR 多模态非裁剪视频检索基准

HumanSense Benchmark 人体感知基准数据集

FrontierScience 推理科研任务评测数据集

Envision 多阶段事件视觉生成数据集

Med-Banana-50K 医学影像编辑数据集

相关数据集

VERA 语音推理评测数据集

TxT360-3efforts 多任务推理数据集

RoVid-X 机器人视频生成数据集

Nemotron-Math-v2 数学推理数据集

MUVR 多模态非裁剪视频检索基准

HumanSense Benchmark 人体感知基准数据集

FrontierScience 推理科研任务评测数据集

Envision 多阶段事件视觉生成数据集

Med-Banana-50K 医学影像编辑数据集