HyperAI超神経

OpenR1-Math-220k 数学推論データセット

日付

2ヶ月前

サイズ

3.51 GB

組織

ライセンス

Apache 2.0

OpenR1-Math-220k は、DeepSeek R1 合成データのギャップを埋めるために 2025 年に Open R1 チームによってリリースされた大規模な数学的推論データセットです。このデータセットには、DeepSeek R1 によって生成された 800,000 の推論軌跡から派生した 220,000 の高品質な数学の問題とその推論軌跡が含まれています。

データセットは 2 つの部分に分かれています。

  • デフォルト (94,000 件の問題): この部分のデータは、教師あり微調整 (SFT) 後に最高のパフォーマンスを発揮します。
  • 拡張版(131,000 問): この部分のデータには、より多くの推論式を提供する cn_k12 などの追加の NuminaMath 1.5 データ ソースが含まれています。
OpenR1-Math-220k.torrent
シーディング 0ダウンロード中 1ダウンロード完了 29総ダウンロード数 57
  • OpenR1-Math-220k/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • OpenR1-Math-220k.zip
          3.51 GB