OpenR1-Math-220k 수학적 추론 데이터 세트
OpenR1-Math-220k는 DeepSeek R1 합성 데이터의 공백을 메우기 위해 Open R1 팀이 2025년에 출시한 대규모 수학적 추론 데이터 세트입니다. 이 데이터 세트에는 220,000개의 고품질 수학 문제와 그 추론 궤적이 포함되어 있으며, 이는 DeepSeek R1이 생성한 800,000개의 추론 궤적에서 파생되었습니다.
데이터 세트는 두 부분으로 나뉩니다.
- 기본값(94k 문제): 이 부분의 데이터는 SFT(지도 미세 조정)를 거친 후 가장 좋은 성능을 보입니다.
- 확장 (131,000개 질문): 이 부분의 데이터에는 더 많은 추론 공식을 제공하는 cn_k12와 같은 추가적인 NuminaMath 1.5 데이터 소스가 포함되어 있습니다.
OpenR1-Math-220k.torrent
시딩 0다운로드 중 1완료됨 29총 다운로드 횟수 57