OpenR1-Math-220k 数学推理数据集
OpenR1-Math-220k 是一个大规模的数学推理数据集,由 Open R1 团队于 2025 年发布,旨在填补 DeepSeek R1 合成数据的缺口。该数据集包含 22 万条高质量的数学问题及其推理轨迹,这些数据源自 80 万条由 DeepSeek R1 生成的推理轨迹。
数据集分为两个部分:
- default(94k 问题):这部分数据在经过监督微调 (SFT) 后表现最佳。
- extended(131k 问题):这部分数据包含额外的 NuminaMath 1.5 数据源,例如 cn_k12,提供了更多的推理公式。
OpenR1-Math-220k.torrent
做种 0正在下载 1已完成 29总下载次数 57