HyperAI超神経

AceMath Instruct Training Data 数的推論データセット

日付

4ヶ月前

サイズ

4.82 GB

組織

エヌビディア

AceMath Instruct Training Data は、2025 年に NVIDIA によってリリースされた AceMath モデルのトレーニングに使用されるデータ セットです。これは、数的推論タスクにおけるモデルのパフォーマンスを向上させることを目的としています。関連する論文の結果は次のとおりです。AceMath: トレーニング後のフロンティア数学推論と報酬モデリングによる進歩”。

このデータセットには複数のステージの微調整データが含まれており、そのうちの最初のステージは general_sft_stage1 2,261,687 個のサンプルが含まれており、主にコードと数学の第 2 段階の命令微調整サンプルをカバーしています。 general_sft_stage2 1,634,573 個のサンプルが含まれており、コード、数学、および一般分野での命令の微調整まで拡張され、特に数学の分野を対象としています。 math_sft 1,661,094 個のサンプルが含まれており、数学的推論スキルの向上に焦点を当てています。データは Qwen2.5-Math-72B-Instruct モデルと GPT-4o-mini モデルの組み合わせを使用して生成され、データの多様性と高品質が保証されています。

AceMath-Instruct-Training-Data.torrent
シーディング 1ダウンロード中 1ダウンロード完了 29総ダウンロード数 36
  • AceMath-Instruct-Training-Data/
    • README.md
      1.61 KB
    • README.txt
      3.23 KB
      • data/
        • AceMath-Instruct-Training-Data.zip
          4.82 GB