Command Palette
Search for a command to run...
CHIMERA 일반 추론 합성 데이터 세트
CHIMERA는 추론 학습을 위해 특별히 설계된 합성 추론 데이터셋입니다. 관련 연구 논문은 다음과 같습니다... CHIMERA: 일반화 가능한 LLM 추론을 위한 소형 합성 데이터 이 데이터 세트는 광범위한 STEM 과목을 포괄하며, 장기적 사고(CoT) 궤적을 제공합니다. 이 데이터셋은 수학, 컴퓨터 과학, 화학, 물리학, 문학, 역사, 생물학, 음성학 등 8개 과목에 걸쳐 9,225개의 문항으로 구성되어 있습니다. 모든 예시는 대규모 언어 모델(LLM)을 통해 생성되었으며, 수동 주석 없이 자동으로 검증되었습니다. 훈련 분배:
- 수학: 4,452
- 컴퓨터 과학: 1,303
- 화학: 1,102
- 물리학: 742
- 문헌: 504
- 역사: 422
- 생물학: 383
- 언어학: 317