s1K-1.1 数学的推論データセット
※本データセットはオンライン利用に対応しておりますが、ジャンプするにはここをクリックしてください。
このデータセットは、スタンフォード大学とワシントン大学の研究チームによって 2025 年に公開された数学の問題推論データセットです。大規模言語モデル (LLM) の導出の論理的一貫性を高め、数学的推論を通じて構造化された思考を最適化することを目的としています。関連する論文の結果は次のとおりです。s1: 単純なテスト時間のスケーリング”。
このデータセットには、代数、幾何学、確率など複数の数学分野を網羅した、数学の問題と推論の軌跡を中心とした 1,000 個のサンプルが含まれています。各サンプルには、問題の説明、問題解決の手順、回答、DeepSeek r1 によって生成された推論の軌跡が含まれています。