s1K-1.1 数学推理数据集
*该数据集支持在线使用,点击此处跳转。
该数据集是一个数学问题推理数据集,由斯坦福大学联合华盛顿大学的研究团队于 2025 年发布,旨在强化大语言模型(LLMs)推导的逻辑连贯性,借数学推理优化其结构化思维。相关论文成果为:「s1: Simple test-time scaling」。
该数据集包含 1,000 条样本,以数学问题及推理轨迹为核心,涵盖代数、几何、概率等多个数学领域,每条样本包含问题描述、解题步骤、答案及由 DeepSeek r1 生成的推理轨迹。