HyperAI超神经

AceMath Instruct Training Data 数学推理数据集

日期

3 个月前

大小

4.82 GB

机构

NVIDIA(英伟达)

发布地址

huggingface.co

AceMath Instruct Training Data 是由 NVIDIA 于 2025 年发布的一个用于训练 AceMath 模型的数据集,旨在提升模型在数学推理任务中的表现,相关论文成果为「AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling」。

该数据集包含多个阶段的微调数据,其中第一阶段的 general_sft_stage1 包含 2,261,687 个样本,主要涵盖代码和数学领域的指令微调样本;第二阶段的 general_sft_stage2 包含 1,634,573 个样本,进一步扩展到代码、数学和通用领域的指令微调;而专门针对数学领域的 math_sft 则包含 1,661,094 个样本,专注于提升数学推理能力。这些数据的生成结合了 Qwen2.5-Math-72B-Instruct 和 GPT-4o-mini 模型,确保了数据的多样性和高质量。

AceMath-Instruct-Training-Data.torrent
做种 1正在下载 1已完成 24总下载次数 35
  • AceMath-Instruct-Training-Data/
    • README.md
      1.61 KB
    • README.txt
      3.23 KB
      • data/
        • AceMath-Instruct-Training-Data.zip
          4.82 GB