HyperAI초신경

DeepMath-103K 수학적 추론 데이터 세트

날짜

15일 전

기관

상하이 교통대학교

발행 주소

huggingface.co

카테고리

다운로드 도움말

DeepMath-103K는 텐센트와 상하이 교통대학교가 2025년에 공동으로 공개한 수학적 추론 모델의 학습 및 평가를 위한 대규모 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.DeepMath-103K: 추론 발전을 위한 대규모, 도전적이며, 오염 제거되고 검증 가능한 수학 데이터 세트".

이 데이터 세트는 대수학, 미적분학, 수론, 기하학, 확률, 이산 수학 및 기타 분야를 포괄하는 5~9레벨의 수학 문제에 초점을 맞추고 있으며, 복잡한 추론 능력에 도전하는 데 중점을 두고 있습니다. 또한, 이 데이터 세트는 의미적 매칭을 통해 일반적인 벤치마크에 대한 자세한 오염 제거 처리를 수행하여 테스트 세트 누출을 최소화하고 공정한 모델 평가를 촉진합니다.

DeepMath-103K에서 다루는 수학 주제의 계층적 분류