OpenThoughts2-1M 推理数据集
OpenThoughts2-1M 是一个开源的推理数据集,该数据集由 Open Thoughts 于 2025 年发布,相关论文成果为:「OpenThoughts: Data Recipes for Reasoning Models」。
该数据集以 OpenThoughts-114k 数据集为基础,添加了 OpenR1 等现有数据集以及其他数学和代码推理数据,数据包含 100 万个高质量示例,涵盖数学、科学、代码和谜题等领域。在此数据集上训练的 OpenThinker2 模型性能可与 DeepSeek-R1-Distill 模型相媲美。

数据结构
open-thoughts2M.torrent
做种 1正在下载 0已完成 4总下载次数 7