HyperAI초신경

PolyMath 수학적 추론 데이터 세트

날짜

8일 전

기관

상하이 교통대학교

발행 주소

huggingface.co

카테고리

다운로드 도움말

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

PolyMath는 알리바바와 상하이 교통대학교가 2025년에 공동으로 공개한 수학적 추론 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.PolyMath: 다국어 맥락에서의 수학적 추론 평가"는 수학적 추론 연구를 촉진하는 것을 목표로 합니다.

이 데이터세트는 각 언어 레벨별로 125개의 문항으로 구성된 500개의 고품질 수학적 추론 문제를 포함하고 있습니다. 사고의 깊이와 지식의 폭이라는 두 가지 핵심 차원을 활용하여 K-12부터 올림피아드 경시대회, 그리고 고급 프론티어 수학까지 네 가지 레벨에 걸쳐 수학적 난이도를 정의하고 분류합니다.

데이터 세트 기능:

  • 언어 다양성: PolyMath의 모든 문제는 18개 병렬 언어로 제공되며, 전 세계 75% 이상의 모국어 화자와 주요 언어 계열을 포괄하여 자원이 풍부한 언어와 자원이 부족한 언어 모두에서 다양성을 보장합니다.
  • 고품질 주석: 각 질문 번역은 언어학자에 의해 교정되므로 LLM에서 생성된 출력을 직접 사용하지 않고 정확하고 명확한 용어와 논리를 보장합니다.
데이터 세트의 언어 분포