日期

1 年前

数据集组织

论文 URL

标签

该数据集是一个数学问题推理数据集，由斯坦福大学联合华盛顿大学的研究团队于 2025 年发布，旨在强化大语言模型（LLMs）推导的逻辑连贯性，借数学推理优化其结构化思维。相关论文成果为：「s1: Simple test-time scaling」。该数据集包含 1,000 条样本，以数学问题及推理轨迹为核心，涵盖代数、几何、概率等多个数学领域，每条样本包含问题描述、解题步骤、答案及由 DeepSeek r1 生成的推理轨迹。

Citation

@misc{muennighoff2025s1simpletesttimescaling, title={s1: Simple test-time scaling}, author={Niklas Muennighoff and Zitong Yang and Weijia Shi and Xiang Lisa Li and Li Fei-Fei and Hannaneh Hajishirzi and Luke Zettlemoyer and Percy Liang and Emmanuel Candès and Tatsunori Hashimoto}, year={2025}, eprint={2501.19393}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2501.19393}, }

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集在 Discord 上讨论

日期

1 年前

数据集组织

论文 URL

arxiv.org

标签

数学

Citation

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

MAKIEVAL 多语言文化知识评估数据集

1 天前

SAM 3D Artist Objects 3D 物体重建数据集

5 天前

FigureBench 科学插图生成基准数据集

7 天前

SMOL 多语言翻译平行数据集

1 个月前

Rice Leaf Diseases 水稻叶片病害检测数据集

1 个月前

Eye Disease Classification Fundus 眼底疾病分类数据集

1 个月前

Medical Waste 医疗废弃物检测数据集

2 个月前

RSRCC 遥感区域变化理解基准数据集

8 天前

Transfermarkt Football 足球转会数据集

2 个月前

ParseBench 文档解析能力评测数据集

2 个月前

Emotion-probes 情绪探测数据集

2 个月前

OmniParsingBench 多模态解析能力评估数据集

8 天前

Simple Voice Questions 简单语音问题数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

s1K-1.1 数学推理数据集

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

s1K-1.1 数学推理数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

SMOL 多语言翻译平行数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Medical Waste 医疗废弃物检测数据集

RSRCC 遥感区域变化理解基准数据集

Transfermarkt Football 足球转会数据集

ParseBench 文档解析能力评测数据集

Emotion-probes 情绪探测数据集

OmniParsingBench 多模态解析能力评估数据集

Simple Voice Questions 简单语音问题数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

s1K-1.1 数学推理数据集

Citation

相关数据集

MAKIEVAL 多语言文化知识评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

SMOL 多语言翻译平行数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Medical Waste 医疗废弃物检测数据集

RSRCC 遥感区域变化理解基准数据集

Transfermarkt Football 足球转会数据集

ParseBench 文档解析能力评测数据集

Emotion-probes 情绪探测数据集

OmniParsingBench 多模态解析能力评估数据集

Simple Voice Questions 简单语音问题数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

MAKIEVAL 多语言文化知识评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

SMOL 多语言翻译平行数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Medical Waste 医疗废弃物检测数据集

RSRCC 遥感区域变化理解基准数据集

Transfermarkt Football 足球转会数据集

ParseBench 文档解析能力评测数据集

Emotion-probes 情绪探测数据集

OmniParsingBench 多模态解析能力评估数据集

Simple Voice Questions 简单语音问题数据集

相关数据集

MAKIEVAL 多语言文化知识评估数据集

SAM 3D Artist Objects 3D 物体重建数据集

FigureBench 科学插图生成基准数据集

SMOL 多语言翻译平行数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

Eye Disease Classification Fundus 眼底疾病分类数据集

Medical Waste 医疗废弃物检测数据集

RSRCC 遥感区域变化理解基准数据集

Transfermarkt Football 足球转会数据集

ParseBench 文档解析能力评测数据集

Emotion-probes 情绪探测数据集

OmniParsingBench 多模态解析能力评估数据集

Simple Voice Questions 简单语音问题数据集