HyperAI초신경

OpenMathReasoning 수학적 추론 데이터 세트

날짜

6일 전

기관

엔비디아

발행 주소

huggingface.co

카테고리

다운로드 도움말

OpenMathReasoning 데이터 세트는 NVIDIA가 2025년에 공개한 수학적 추론에 초점을 맞춘 세계 최초의 대규모 고품질 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.AIMO-2 우승 솔루션: OpenMathReasoning 데이터 세트를 사용하여 최첨단 수학적 추론 모델 구축"는 OpenMath-Nemotron 시리즈 모델이 수학적 추론 분야에서 뛰어난 성과를 달성하도록 돕는 것을 목표로 합니다.

데이터 세트에는 수학 문제 유형 레이블, 자세한 문제 해결 단계, 문제 난이도 수준 분류를 포함한 다차원의 자세한 주석이 포함되어 있습니다. 수학 전문 분야와 온라인 커뮤니티에서 나온 이러한 고품질 데이터는 수학적 추론 과정과 수학 문제 해결 모델의 최적화에 대한 심층 연구를 위한 견고하고 강력한 지원을 제공하며, 지능형 수학 튜터링 시스템, 수학 경연 대회 보조 도구, 과학 연구 컴퓨팅 자동화 등 관련 산업의 활발한 발전을 촉진합니다.

데이터 세트에는 다음이 포함됩니다.

  • AoPS 포럼의 540K개의 고유한 수학 문제
  • 320만 장기 신뢰 전략(CoT) 솔루션
  • 1.7M 길이의 Tool Integrated Reasoning(TIR) 솔루션
  • 많은 후보자 중에서 가장 유망한 솔루션을 선택하기 위한 566K 샘플(GenSelect)