日期

1 年前

数据集组织

论文 URL

标签

AceReason-1.1-SFT 是由英伟达于 2025 年发布的一个多样化且高质量的监督式微调（SFT）数据集，专注于数学和代码推理。相关论文成果为：「AceReason-Nemotron 1.1: Advancing Math and Code Reasoning through SFT and RL Synergy」，旨在训练专注于数学和代码推理的 SFT 模型。该数据集作为数学和代码推理模型 AceReason-Nemotron-1.1-7B 的 SFT 训练数据，数据集中的所有回答均由 DeepSeek-R1 生成。 AceReason-1.1-SFT 数据集包含 2,668,741 个数学样本和 1,301,591 个代码样本，涵盖来自 OpenMathReasoning 、 NuminaMath-CoT 、 OpenCodeReasoning 、 MagicoderEvolInstruct 、 opc-sft-stage2 、 leetcode 、 TACO 和 apps 等数据源的数据。该数据集进行了数据净化，并过滤了与数学和编码基准测试中任何测试样本有 9-gram 重叠的样本。

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

zh-meme-sft-8k 中文互联网梗文化数据集

Command Palette

AceReason-1.1-SFT 数学代码推理数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

AceReason-1.1-SFT 数学代码推理数据集

相关数据集

CHOCLO 拉丁美州文化基准数据集

COCO-2017-Vietnamese 越南语图像检测数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

zh-meme-sft-8k 中文互联网梗文化数据集

CHIMERA 通用推理合成数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

Diabetes Mexico 墨西哥糖尿病数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

AceReason-1.1-SFT 数学代码推理数据集

相关数据集

CHOCLO 拉丁美州文化基准数据集

COCO-2017-Vietnamese 越南语图像检测数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

zh-meme-sft-8k 中文互联网梗文化数据集

CHIMERA 通用推理合成数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

Diabetes Mexico 墨西哥糖尿病数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

CHOCLO 拉丁美州文化基准数据集

COCO-2017-Vietnamese 越南语图像检测数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

zh-meme-sft-8k 中文互联网梗文化数据集

CHIMERA 通用推理合成数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

Diabetes Mexico 墨西哥糖尿病数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集

相关数据集

CHOCLO 拉丁美州文化基准数据集

COCO-2017-Vietnamese 越南语图像检测数据集

DRACO 跨领域深度研究基准数据集

Nemotron Personas France 法国合成人物数据集

zh-meme-sft-8k 中文互联网梗文化数据集

CHIMERA 通用推理合成数据集

THINGS-MEG 脑磁图数据集

THINGS-fMRI 功能磁共振成像数据集

Nemotron-Personas-Brazil 巴西合成角色数据集

Diabetes Mexico 墨西哥糖尿病数据集

Nemotron-Math-v2 数学推理数据集

GroundingME 复杂场景理解评测数据集

MCIF 多模态跨语言指令跟随数据集

TxT360-3efforts 多任务推理数据集