HyperAI
Command Palette
Search for a command to run...
CHIMERA一般推論合成データセット
CHIMERA は推論トレーニング用に特別に設計された合成推論データセットです。関連する研究論文には以下が含まれます... CHIMERA: 一般化可能な LLM 推論のためのコンパクトな合成データ このデータセットは、幅広い STEM 科目をカバーし、長連鎖思考 (CoT) の軌跡を提供します。
このデータセットには、8つの科目(数学、コンピュータサイエンス、化学、物理学、文学、歴史、生物学、音声学)にわたる9,225の質問が含まれています。すべての例は大規模言語モデル(LLM)によって生成され、手動によるアノテーションなしで自動的に検証されます。
規律の配分:
- 数学:4,452
- コンピュータサイエンス: 1,303
- 化学: 1,102
- 物理学:742
- 文学: 504
- 歴史: 422
- 生物学: 383
- 言語学: 317
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。