HyperAIHyperAI

Command Palette

Search for a command to run...

CHIMERA 일반 추론 합성 데이터 세트

날짜

2달 전

Paper URL

2603.00889

라이선스

Apache 2.0

CHIMERA는 추론 학습을 위해 특별히 설계된 합성 추론 데이터셋입니다. 관련 연구 논문은 다음과 같습니다... CHIMERA: 일반화 가능한 LLM 추론을 위한 소형 합성 데이터 이 데이터 세트는 광범위한 STEM 과목을 포괄하며, 장기적 사고(CoT) 궤적을 제공합니다. 이 데이터셋은 수학, 컴퓨터 과학, 화학, 물리학, 문학, 역사, 생물학, 음성학 등 8개 과목에 걸쳐 9,225개의 문항으로 구성되어 있습니다. 모든 예시는 대규모 언어 모델(LLM)을 통해 생성되었으며, 수동 주석 없이 자동으로 검증되었습니다. 훈련 분배:

  • 수학: 4,452
  • 컴퓨터 과학: 1,303
  • 화학: 1,102
  • 물리학: 742
  • 문헌: 504
  • 역사: 422
  • 생물학: 383
  • 언어학: 317

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp