HyperAI초신경

OpenThoughts2-1M 추론 데이터 세트

날짜

13일 전

크기

6.91 GB

발행 주소

huggingface.co

카테고리

OpenThoughts2-1M은 Open Thoughts가 2025년에 공개한 오픈소스 추론 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.OpenThoughts: 추론 모델을 위한 데이터 레시피".

이 데이터셋은 OpenThoughts-114k 데이터셋을 기반으로 OpenR1 및 기타 수학 및 코드 추론 데이터와 같은 기존 데이터셋을 추가했습니다. 이 데이터셋에는 수학, 과학, 코드, 퍼즐을 아우르는 100만 개의 고품질 예제가 포함되어 있습니다. 이 데이터셋으로 학습된 OpenThinker2 모델의 성능은 DeepSeek-R1-Distill 모델과 유사합니다.

데이터 구조

open-thoughts2M.torrent
시딩 1다운로드 중 0완료됨 4총 다운로드 횟수 7
  • open-thoughts2M/
    • README.md
      1.27 KB
    • README.txt
      2.54 KB
      • data/
        • open-thoughts2M.zip
          6.91 GB