日期
大小
发布地址
huggingface.co
标签
分类
Dolphin-R1 是一个由 Cognitive Computations 团队于 2025 年创建的数据集,旨在为训练类似 DeepSeek-R1 的推理模型提供高质量的样本。该数据集包含约 80 万个样本,数据来源包括 DeepSeek-R1 、 Gemini Flash 以及 Dolphin Chat 提供的 20 万个样本。这些样本主要用于提升模型在推理任务中的表现,涵盖数学、逻辑、编码等复杂任务。