HyperAI초신경

OpenR1-Math-220k 수학적 추론 데이터 세트

날짜

2달 전

크기

3.51 GB

기관

발행 주소

huggingface.co

라이선스

Apache 2.0

OpenR1-Math-220k는 DeepSeek R1 합성 데이터의 공백을 메우기 위해 Open R1 팀이 2025년에 출시한 대규모 수학적 추론 데이터 세트입니다. 이 데이터 세트에는 220,000개의 고품질 수학 문제와 그 추론 궤적이 포함되어 있으며, 이는 DeepSeek R1이 생성한 800,000개의 추론 궤적에서 파생되었습니다.

데이터 세트는 두 부분으로 나뉩니다.

  • 기본값(94k 문제): 이 부분의 데이터는 SFT(지도 미세 조정)를 거친 후 가장 좋은 성능을 보입니다.
  • 확장 (131,000개 질문): 이 부분의 데이터에는 더 많은 추론 공식을 제공하는 cn_k12와 같은 추가적인 NuminaMath 1.5 데이터 소스가 포함되어 있습니다.
OpenR1-Math-220k.torrent
시딩 0다운로드 중 1완료됨 29총 다운로드 횟수 57
  • OpenR1-Math-220k/
    • README.md
      1.29 KB
    • README.txt
      2.58 KB
      • data/
        • OpenR1-Math-220k.zip
          3.51 GB