OpenThoughts2-1M 추론 데이터 세트
OpenThoughts2-1M은 Open Thoughts가 2025년에 공개한 오픈소스 추론 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.OpenThoughts: 추론 모델을 위한 데이터 레시피".
이 데이터셋은 OpenThoughts-114k 데이터셋을 기반으로 OpenR1 및 기타 수학 및 코드 추론 데이터와 같은 기존 데이터셋을 추가했습니다. 이 데이터셋에는 수학, 과학, 코드, 퍼즐을 아우르는 100만 개의 고품질 예제가 포함되어 있습니다. 이 데이터셋으로 학습된 OpenThinker2 모델의 성능은 DeepSeek-R1-Distill 모델과 유사합니다.

데이터 구조
open-thoughts2M.torrent
시딩 1다운로드 중 0완료됨 4총 다운로드 횟수 7