s1K-1.1 수학적 추론 데이터 세트
*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭해서 이동하세요.
이 데이터 세트는 스탠포드 대학과 워싱턴 대학의 연구팀이 2025년에 공개한 수학적 문제 추론 데이터 세트입니다. 대규모 언어 모델(LLM)의 도출에 있어 논리적 일관성을 강화하고 수학적 추론을 통해 구조화된 사고를 최적화하는 것을 목표로 합니다. 관련 논문 결과는 다음과 같습니다.s1: 간단한 테스트 시간 스케일링".
이 데이터 세트에는 대수, 기하학, 확률 등 여러 수학 분야를 포괄하는 수학적 문제와 추론 경로를 중심으로 1,000개의 샘플이 포함되어 있습니다. 각 샘플에는 DeepSeek r1이 생성한 문제 설명, 문제 해결 단계, 답변 및 추론 궤적이 포함되어 있습니다.