HyperAI초신경

OpenThoughts-114k 추론 데이터 세트

날짜

3달 전

크기

922.07 MB

기관

발행 주소

github.com

라이선스

Apache 2.0

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

OpenThoughts-114k는 수학, 코딩, 과학, 퍼즐과 같은 분야에 초점을 맞춘 오픈 소스 추론 데이터 세트로, 114,000개의 고품질 샘플을 포함하고 있습니다. Open Thoughts에서 2025년에 공개한 이 데이터 세트는 수학 및 코드 추론 작업에서 기존의 대규모 모델(예: DeepSeek-R1-Distill-Qwen-32B 및 DeepSeek-R1-Distill-Qwen-7B)보다 우수한 성능을 발휘하도록 소규모 추론 모델을 훈련하는 것을 목표로 합니다.

데이터 세트 생성 프로세스
OpenThoughts-114k.torrent
시딩 2다운로드 중 1완료됨 64총 다운로드 횟수 122
  • OpenThoughts-114k/
    • README.md
      1.12 KB
    • README.txt
      2.25 KB
      • data/
        • OpenThoughts-114k.zip
          922.07 MB