Command Palette
Search for a command to run...
산술 추론/기호 논리/시각 수학/기하 분석을 포함하는 7가지 주요 수학적 추론 데이터 세트 모음

대규모 모델 역량의 급속한 발전으로 수학적 추론은 인간만의 지적 활동에서 인공지능 분야에서 가장 어려운 영역 중 하나로 진화하고 있습니다. 논리적 추론, 공식 계산, 다단계 사고와 같이 한때 인간의 이성에 의존했던 작업들이 이제 기계에 의해 점차 "이해"되고 "학습"되고 있습니다.그러나 언어 이해나 이미지 인식과 달리 수학적 추론은 모델이 질문의 표면적 의미를 이해하는 데 그치지 않고 그 이면에 있는 논리적 구조에 대한 통찰력도 필요로 하므로 모델의 성능은 특히 데이터 품질에 따라 달라집니다.
모델이 "계산"에서 "추론"으로 발전하려면 고품질의 구조화되고 논리적으로 일관된 데이터의 뒷받침이 필요합니다. 체계적이고 계층적이며 논리적으로 일관된 데이터 세트는 모델이 추상적 기호의 이면에 있는 추론 원리를 파악할 수 있는지 여부를 결정할 뿐만 아니라, 개방형 환경에서 일반화하고 스스로 교정하는 능력에도 영향을 미칩니다.일반적인 자연어 코퍼스와 비교했을 때, 수학적 추론 데이터 세트는 문제 분포의 다양성, 문제 해결 경로의 설명 가능성, 추론 체인의 완전한 주석에 더 중점을 두어 모델의 학습 과정이 인간의 사고에 최대한 가깝도록 보장합니다.
전반적인,수학적 추론은 인공지능이 "설명 가능한 지능"으로 나아가는 데 중요한 창이 되고 있습니다.이 분야의 연구와 응용을 촉진하기 위해 HyperAI는 저장대학교, 홍콩대학교, NVIDIA, OpenAI, Alibaba 등 전 세계의 주요 기관과 기업에서 수집한 일련의 수학적 추론 데이터 세트를 편집했으며, 여기에는 시각 수학 및 기하학적 분석 등 다양한 분야가 포함됩니다.
더 많은 오픈 소스 데이터 세트를 보려면 클릭하세요.
수학적 추론 데이터 세트 요약
1. We-Math2.0-Standard 벤치마크 데이터 세트
예상 크기:369.86MB
다운로드 주소:https://go.hyper.ai/1dAZ2
We-Math2.0-Standard는 베이징우전대학교, 텐센트, 칭화대학교가 2025년에 발표한 시각적 수학적 추론을 위한 표준 데이터셋입니다. 관련 논문의 제목은 "WE-MATH 2.0: 시각적 수학적 추론을 장려하는 다재다능한 MathBook 시스템"입니다. We-Math2.0-Standard는 진단, 설명 및 비교가 가능한 평가 기반을 제공하는 것을 목표로 합니다.
서류 주소:
https://hyper.ai/en/papers/2508.10433
이 데이터세트는 1,819개의 정확하게 정의된 지식 원리를 중심으로 통합 레이블 공간을 구축하고, 각 질문에 해당 원리를 명시적으로 주석으로 달고 엄격하게 큐레이션하여 전반적으로 광범위하고 균형 잡힌 커버리지를 달성합니다. 특히 이전에는 제대로 표현되지 않았던 수학 하위 분야와 질문 유형을 강화합니다. 이 데이터세트는 이중 확장 설계를 채택합니다.
* 첫째, 질문당 여러 이미지를 사용하여 다양한 출처의 시각적 증거의 통합과 정렬을 테스트합니다.
* 두 번째로, 이미지당 여러 질문을 사용하여 동일한 시각적 맥락에서 다중 원리 전환과 개념적 유연성을 테스트합니다.
각 예시는 이미지와 텍스트 줄기로 구성되어 있으며, 질문에 필요한 지식 원칙과 표준 답변에 대한 주석이 함께 제공됩니다.
2. NuminaMath-LEAN 수학 문제 데이터 세트
예상 크기:65.06MB
다운로드 주소:https://go.hyper.ai/BfJFv
NuminaMath-LEAN은 Numina와 Kimi 팀이 2025년에 공동으로 발표한 수학 문제 데이터셋입니다. 관련 논문은 "Kimina-Prover Preview: Towards Large Formal Reasoning Models with Reinforcement Learning"입니다. 이 데이터셋은 자동화된 정리 증명 모델의 학습 및 평가를 위해 수동으로 주석이 추가된 정형화된 명제와 증명을 제공하는 것을 목표로 합니다.
서류 주소:
https://hyper.ai/en/papers/2504.11354
이 데이터셋에는 국제수학올림피아드(IMO) 및 미국수학올림피아드(USAMO)와 같은 권위 있는 대회의 문제를 포함하여 10만 개의 수학 경시대회 문제가 포함되어 있습니다. 데이터 유형에는 문제 진술, 문제 유형 분류, 정답, 출처, 정형 증명, 주석자 정보, 강화 학습 학습 과정 기록 등이 포함됩니다.
3. T-Wix 러시아 SFT 데이터 세트
예상 크기:1.43GB
다운로드 주소:https://go.hyper.ai/5XULu
T-Wix는 러시아의 SFT 데이터셋입니다. 관련 논문은 "양에서 질로: 학습 튜닝을 위한 자가 학습 데이터 선택을 통한 LLM 성능 향상"으로, 알고리즘 및 수학 문제 해결부터 대화, 논리적 사고 및 추론 패턴까지 모델의 역량을 향상시키는 것을 목표로 합니다.
서류 주소:
https://arxiv.org/abs/2308.12032
이 데이터세트에는 수학, 과학, 프로그래밍, 일반 지식, 학습 지도, 롤플레잉 등 다양한 분야를 포괄하는 468,614개의 일반 샘플을 포함하여 499,598개의 러시아어 샘플이 포함되어 있습니다. 추론 샘플에는 고급 수학 및 과학 문제에 초점을 맞춘 30,984개의 데이터 포인트가 포함되어 있으며, 상세한 추론 추적을 제공합니다.
4. Nemotron-Math-HumanReasoning 수학적 추론 데이터 세트
예상 크기:639.91KB
다운로드 주소:https://go.hyper.ai/28kjP
Nemotron-Math-HumanReasoning은 NVIDIA가 2025년에 발표한 수학적 추론 데이터 세트입니다. 관련 논문 결과는 "강화학습이나 증류 없이 LLM에게 추론을 가르치는 과제"로, DeepSeek-R1과 같은 모델의 확장 추론 스타일을 시뮬레이션하는 것을 목표로 합니다.
서류 주소:
https://arxiv.org/abs/2507.09850
이 데이터 세트에는 OpenMathReasoning 데이터 세트의 수학 문제 50개, 사람이 작성한 솔루션 200개, QwQ-32B-Preview에서 생성한 추가 솔루션 50개가 포함되어 있습니다.
5. Open-Omega-Atom-1.5M 데이터셋
예상 크기:6.6GB
다운로드 주소:https://go.hyper.ai/bndWW
Open-Omega-Atom-1.5M은 수학과 과학의 추론 능력을 향상시키도록 설계된 수학 및 과학 추론 데이터 세트입니다.
이 데이터 세트에는 약 150만 개의 데이터가 포함되어 있으며, 수학, 과학 및 코드 응용 프로그램을 위해 설계되었으며, 구성의 중요한 부분은 수학적 데이터입니다.
데이터 세트 기능:
* 간결하고 고품질: 명확하고 도전적인 문제와 단계별 솔루션에 중점을 둡니다.
* STEM 중심: 수학 전공에 수학, 코드 추론, 과학적 사고를 통합합니다.
* 큐레이션 및 최적화: 최적의 다양성과 일관성을 달성하기 위해 고품질 오픈 데이터 세트와 맞춤형 데이터에서 데이터를 선택적으로 수집합니다.
* 추론에 적합: 단계 기반 및 논리 기반 문제 해결에 대한 강력한 적용 범위를 가지고 있으며 추론 엔진의 벤치마크 역할을 할 수 있습니다.
6. GSM8K 수학적 추론 데이터 세트
예상 크기:4.92MB
다운로드 주소:https://go.hyper.ai/d9PZh
GSM8K는 OpenAI가 2022년에 발표한 수학적 추론 데이터 세트입니다. 관련 논문 결과는 "수학 문제 해결을 위한 검증자 훈련"으로, 복잡한 수학 문제를 이해하고 해결하는 데 있어 머신 러닝 모델의 성능을 개선하는 것을 목표로 합니다.
서류 주소:
https://arxiv.org/abs/2110.14168
이 데이터세트에는 대수, 산수, 기하학 및 기타 분야를 포함하여 다양한 언어로 작성된 8.5k개의 고품질 초등학교 수학 문제들이 포함되어 있습니다. 문제 해결 단계는 2~8단계로 구성됩니다. 해결 과정은 주로 기본적인 산술 연산(+ − × ÷)을 사용한 일련의 간단한 계산으로 구성되어 최종 답을 구합니다.
7. VCBench 수학적 추론 벤치마크 데이터 세트
예상 크기:86.04MB
다운로드 주소:https://hyper.ai/cn/datasets/43960
VCBench는 알리바바와 저장대학교가 2025년에 공개한 명시적 시각적 종속성을 통한 다중 모드 수학적 추론을 평가하기 위한 벤치마크 데이터 세트입니다. 이 데이터 세트에는 1,720개의 질문-답변 쌍과 총 6,697개의 이미지가 포함되어 있습니다.
질문은 주로 다음 6가지 영역을 포함합니다.
* 시간과 달력: 두 가지 하위 범주(달력과 시계)에 대한 시간 추론 문제를 테스트하며, 시간 간격과 달력 기반 계산에 대한 이해가 필요합니다.
* 공간과 위치: 이 과제는 세 가지 하위 범주(방향, 위치, 장소)에 걸친 공간적 추론에 초점을 맞춰 상대적 위치, 방향, 공간적 관계에 대한 이해도를 평가합니다.
* 기하학과 도형: 각도, 사각형, 직사각형, 도형, 삼각형의 5가지 하위 범주를 다루는 문제는 기본적인 도형 인식에서 보다 복잡한 속성 분석까지 기본적인 기하학적 이해력을 테스트합니다.
* 물체와 운동: 두 가지 하위 범주(큐브와 이동)의 과제는 3차원 물체와 운동 변환에 대한 이해도를 평가합니다.
* 추론 및 관찰: 두 하위 범주(추론 및 관찰)의 문제는 논리적 추론과 주의 깊은 시각적 관찰 기술을 테스트하도록 설계되었습니다.
* 조직 및 패턴: 3가지 하위 범주(조직, 패턴, 가중치)에 걸친 과제를 통해 패턴 인식, 시퀀싱, 조직 논리를 평가합니다.
위 내용은 이번 호에 추천된 데이터셋을 요약한 것입니다. 클릭 한 번으로 다운로드하세요~