HyperAI초신경

OpenThoughts3-1.2M 추론 데이터 세트

날짜

5일 전

발행 주소

huggingface.co

카테고리

다운로드 도움말

OpenThoughts3-1.2M은 OpenThoughts에서 2025년에 공개한 오픈소스 추론 데이터셋입니다. OpenThoughts 데이터셋 시리즈의 세 번째 버전입니다. 관련 논문 결과는 다음과 같습니다.OpenThoughts: 추론 모델을 위한 데이터 레시피".

이 데이터 세트에는 850,000개의 수학 문제, 250,000개의 코딩 문제, 100,000개의 과학 문제가 포함되어 있으며, 주석은 QwQ-32B 모델을 사용하여 완성되었습니다.

데이터셋 프레임워크