Command Palette
Search for a command to run...
Nemotron-SFT-Math-v4 数学推理 SFT 数据集
Nemotron-SFT-Math-v4 是由 NVIDIA 于 2026 年 5 月发布的数学推理数据集,相关论文成果为 Nemotron-Math: Efficient Long-Context Distillation of Mathematical Reasoning from Multi-Mode Supervision,旨在解决传统数学数据集质量参差不齐、推理轨迹不规范、准确率低、场景单一的问题,有效提升模型结构化推理、多轨迹推理与答案校验能力,广泛用于大模型数学推理微调、推理轨迹分析、答案校验算法研发、长上下文推理系统搭建与模型推理鲁棒性评测。 该数据集包含 545,431 条训练样本,涵盖 285,516 条 COT 思维推理样本与 259,915 条 TIR 工具推理样本,覆盖代数、几何、数论、组合数学等竞赛与高校科研级数学场景,数据采用人工与自动化混合标注方式,包含唯一编号、题目文本、多轮对话、标准答案、来源、协议等标准化字段。