HyperAI超神经

OpenThoughts2-1M 推理数据集

日期

13 days ago

大小

6.91 GB

发布地址

huggingface.co

OpenThoughts2-1M 是一个开源的推理数据集,该数据集由 Open Thoughts  于 2025 年发布,相关论文成果为:「OpenThoughts: Data Recipes for Reasoning Models」。

该数据集以 OpenThoughts-114k 数据集为基础,添加了 OpenR1 等现有数据集以及其他数学和代码推理数据,数据包含 100 万个高质量示例,涵盖数学、科学、代码和谜题等领域。在此数据集上训练的 OpenThinker2 模型性能可与 DeepSeek-R1-Distill 模型相媲美。

数据结构

open-thoughts2M.torrent
做种 1正在下载 0已完成 4总下载次数 7
  • open-thoughts2M/
    • README.md
      1.27 KB
    • README.txt
      2.54 KB
      • data/
        • open-thoughts2M.zip
          6.91 GB