Command Palette

Search for a command to run...

AceMath Instruct Training Data 数学推理数据集

日期

9 个月前

大小

4.82 GB

机构

NVIDIA(英伟达)

论文链接

arxiv.org

AceMath Instruct Training Data 是由 NVIDIA 于 2025 年发布的一个用于训练 AceMath 模型的数据集,旨在提升模型在数学推理任务中的表现,相关论文成果为「AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling」。

该数据集包含多个阶段的微调数据,其中第一阶段的 general_sft_stage1 包含 2,261,687 个样本,主要涵盖代码和数学领域的指令微调样本;第二阶段的 general_sft_stage2 包含 1,634,573 个样本,进一步扩展到代码、数学和通用领域的指令微调;而专门针对数学领域的 math_sft 则包含 1,661,094 个样本,专注于提升数学推理能力。这些数据的生成结合了 Qwen2.5-Math-72B-Instruct 和 GPT-4o-mini 模型,确保了数据的多样性和高质量。

AceMath-Instruct-Training-Data.torrent
做种 1正在下载 0已完成 125总下载次数 180
  • AceMath-Instruct-Training-Data/
    • README.md
      1.61 KB
    • README.txt
      3.23 KB
      • data/
        • AceMath-Instruct-Training-Data.zip
          4.82 GB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供