HyperAI超神经

首页算力平台文档资讯论文教程数据集百科 SOTA LLM 模型天梯 GPU 天梯顶会

中文

HyperAI超神经

Llama-Nemotron-Post-Training-Dataset 后训练数据集

日期

2 个月前

机构

论文链接

许可协议

CC BY 4.0

标签

在线使用此数据集加入 Discord 社区

Llama-Nemotron-Post-Training-Dataset 是由英伟达于 2025 年开源的大规模后训练数据集，相关论文成果为「Llama-Nemotron: Efficient Reasoning Models」，旨在提升 Llama-Nemotron 系列模型在后训练阶段（如 SFT 、 RL）的数学、代码、通用推理与指令跟随等能力。

该数据集整合了监督式微调（SFT）与强化学习（RL）阶段的数据。当前版本为 v1.1（较前版本新增约 220 万条数学样本与 50 万条代码推理样本），适用于训练 AI 智能体（Agent）、聊天机器人、 RAG 系统及其他 AI 驱动应用。

数据分布（按类别条目数）

数学（math）：22,066,397
代码（code）：10,108,883
科学（science）：708,920
指令跟随（instruction following）：56,339
对话（chat）：39,792
安全（safety）：31,426

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程

即用型 GPU

最优价格

Hyper Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供