Llama-Nemotron 推理数据集
该数据集是由 NVIDIA 于 2025 年发布的高质量多领域推理数据集,相关论文成果为:「Llama-Nemotron: Efficient Reasoning Models」, 旨在支持大语言模型在数学、代码、科学推理及指令跟随等任务上的性能提升,助力 Llama-3.1/3.3-Nemotron 系列模型实现更高效的推理能力。
该数据集包含数学数据约 2206 万、代码数据约 1010 万,其余为科学、指令跟随等领域数据,数据由 Llama-3.3-70B-Instruct 、 DeepSeek-R1 、 Qwen-2.5 等多模型协同生成,涵盖多样化推理风格与解题路径,满足大规模模型训练的多样性需求。
Llama-Nemotron.torrent
做种 1正在下载 0已完成 7总下载次数 11