OpenThoughts2-1M推論データセット
OpenThoughts2-1Mは、2025年にOpen Thoughtsによってリリースされたオープンソースの推論データセットです。関連する論文結果は次のとおりです。OpenThoughts: 推論モデルのためのデータレシピ”。
このデータセットはOpenThoughts-114kデータセットをベースに、OpenR1などの既存の数学・コード推論データデータセットを追加したものです。このデータには、数学、科学、コード、パズルなど、100万件の高品質な例が含まれています。このデータセットで学習したOpenThinker2モデルの性能は、DeepSeek-R1-Distillモデルに匹敵します。

データ構造
open-thoughts2M.torrent
シーディング 2ダウンロード中 0ダウンロード完了 4総ダウンロード数 7