Command Palette
Search for a command to run...
CHIMERA Allgemeines Inferenz-Synthetik-Datensatz
CHIMERA ist ein synthetischer Inferenzdatensatz, der speziell für das Inferenztraining entwickelt wurde; zugehörige Forschungsarbeiten umfassen... CHIMERA: Kompakte synthetische Daten für verallgemeinerbares LLM-Schlussfolgern Dieser Datensatz deckt ein breites Spektrum an MINT-Fächern ab und bietet Einblicke in Denkketten (Long Chain Thinking, CoT).
Dieser Datensatz enthält 9.225 Fragen aus acht Fachgebieten (Mathematik, Informatik, Chemie, Physik, Literatur, Geschichte, Biologie und Phonetik). Alle Beispiele wurden mithilfe eines großen Sprachmodells (LLM) generiert und automatisch ohne manuelle Annotation validiert.
Disziplinverteilung:
- Mathematik: 4.452
- Informatik: 1.303
- Chemie: 1.102
- Physik: 742
- Literatur: 504
- Geschichte: 422
- Biologie: 383
- Linguistik: 317
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.