Command Palette
Search for a command to run...
Nemotron-SFT-Math-v4 数学的推論SFTデータセット
Nemotron-SFT-Math-v4は、NVIDIAが2026年5月に公開した数学的推論データセットです。関連する研究論文は以下のとおりです。 Nemotron-Math: マルチモード監視からの数学的推論の効率的なロングコンテキスト抽出本手法は、従来の数学データセットの品質のばらつき、非標準的な推論経路、低い精度、および限られたシナリオといった問題を解決することを目的としています。モデルの構造化推論、マルチ経路推論、および解答検証能力を効果的に向上させます。大規模な数学的推論モデルの微調整、推論経路分析、解答検証アルゴリズムの開発、長文脈推論システムの構築、およびモデル推論の堅牢性評価に幅広く活用されています。 このデータセットには、545,431個のトレーニングサンプルが含まれており、その内訳はCOT推論サンプル285,516個とTIRツール推論サンプル259,915個です。競技会や大学における代数、幾何学、数論、組み合わせ論などの数学的シナリオを網羅しています。データは、手動と自動を組み合わせたハイブリッド方式で注釈付けされており、固有番号、質問文、複数ターン対話、標準回答、ソース、プロトコルなどの標準化されたフィールドが含まれています。