HyperAIHyperAI

Command Palette

Search for a command to run...

Nemotron-Math-v2 数学推論データセット

Discordで議論

日付

23日前

データセット構成

エヌビディア

Paper URL

2512.15489

ライセンス

CC BY-SA 4.0

Nemotron-Math-v2 は、NVIDIA Corporation が 2025 年にリリースした数学推論データセットです。関連する研究論文には以下が含まれます... Nemotron-Math: マルチモード監視からの数学的推論の効率的なロングコンテキスト抽出 これは主に、LLM が構造化された数学的推論を実行できるようにトレーニングするため、ツール強化推論と純粋言語推論の違いを研究するため、および長期コンテキストまたはマルチトラック推論システムを構築するために使用されます。

このデータセットには、約347,000件の高品質な数学問題と、モデルによって生成された700万件の推論軌跡が含まれています。各問題は、推論深度が高/中/低、Python TIRの有無の6つの構成で解かれ、LLMをアービターとして用いたパイプラインによって検証されます。

データフィールド:

  • 問題: OpenMathReasoning や MathStackExchange などのソースから抽出された問題ステートメント。
  • メッセージ: LLM トレーニングに使用される、ユーザーとアシスタントの会話ログ。
  • expected_answer: 抽出された回答、またはモデルによって生成された多数決の回答。
  • メタデータ: さまざまな推論とツールの使用シナリオにおける合格率
  • data_source: データソースはAoPSまたはStackExchange-Mathです
  • tool: 使用されるツール定義、または空。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています