OpenThoughts3-1.2M推論データセット
OpenThoughts3-1.2Mは、Open Thoughtsが2025年にリリースしたオープンソースの推論データセットです。これはOpenThoughtsデータセットシリーズの第3版です。関連する論文は以下の通りです。OpenThoughts: 推論モデルのためのデータレシピ”。
データセットには、850,000 個の数学の問題、250,000 個のコーディングの問題、100,000 個の科学の問題が含まれており、注釈は QwQ-32B モデルを使用して完成されています。

データセットフレームワーク