AceMath Instruct Training Data 数学推理数据集
AceMath Instruct Training Data 是由 NVIDIA 于 2025 年发布的一个用于训练 AceMath 模型的数据集,旨在提升模型在数学推理任务中的表现,相关论文成果为「AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling」。
该数据集包含多个阶段的微调数据,其中第一阶段的 general_sft_stage1
包含 2,261,687 个样本,主要涵盖代码和数学领域的指令微调样本;第二阶段的 general_sft_stage2
包含 1,634,573 个样本,进一步扩展到代码、数学和通用领域的指令微调;而专门针对数学领域的 math_sft
则包含 1,661,094 个样本,专注于提升数学推理能力。这些数据的生成结合了 Qwen2.5-Math-72B-Instruct 和 GPT-4o-mini 模型,确保了数据的多样性和高质量。
AceMath-Instruct-Training-Data.torrent
做种 1正在下载 1已完成 24总下载次数 35