OpenR1-Math-220k 数学推論データセット
OpenR1-Math-220k は、DeepSeek R1 合成データのギャップを埋めるために 2025 年に Open R1 チームによってリリースされた大規模な数学的推論データセットです。このデータセットには、DeepSeek R1 によって生成された 800,000 の推論軌跡から派生した 220,000 の高品質な数学の問題とその推論軌跡が含まれています。
データセットは 2 つの部分に分かれています。
- デフォルト (94,000 件の問題): この部分のデータは、教師あり微調整 (SFT) 後に最高のパフォーマンスを発揮します。
- 拡張版(131,000 問): この部分のデータには、より多くの推論式を提供する cn_k12 などの追加の NuminaMath 1.5 データ ソースが含まれています。
OpenR1-Math-220k.torrent
シーディング 0ダウンロード中 1ダウンロード完了 29総ダウンロード数 57