s1K-1.1 数学的推論データセット
このデータセットは、スタンフォード大学とワシントン大学の研究チームによって 2025 年に公開された数学の問題推論データセットです。大規模言語モデル (LLM) の導出の論理的一貫性を高め、数学的推論を通じて構造化された思考を最適化することを目的としています。関連する論文の結果は次のとおりです。s1: 単純なテスト時間のスケーリング”。
このデータセットには、代数、幾何学、確率など複数の数学分野を網羅する数学の問題と推論軌跡に焦点を当てた1,000件のサンプルが含まれています。各サンプルには、問題の説明、解答手順、解答、そしてDeepSeek r1によって生成された推論軌跡が含まれています。