HyperAIHyperAI

Command Palette

Search for a command to run...

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Datum

vor 3 Stunden

Paper-URL

2603.00889

Lizenz

Apache 2.0

CHIMERA ist ein synthetischer Inferenzdatensatz, der speziell für das Inferenztraining entwickelt wurde; zugehörige Forschungsarbeiten umfassen... CHIMERA: Kompakte synthetische Daten für verallgemeinerbares LLM-Schlussfolgern Dieser Datensatz deckt ein breites Spektrum an MINT-Fächern ab und bietet Einblicke in Denkketten (Long Chain Thinking, CoT).

Dieser Datensatz enthält 9.225 Fragen aus acht Fachgebieten (Mathematik, Informatik, Chemie, Physik, Literatur, Geschichte, Biologie und Phonetik). Alle Beispiele wurden mithilfe eines großen Sprachmodells (LLM) generiert und automatisch ohne manuelle Annotation validiert.

Disziplinverteilung:

  • Mathematik: 4.452
  • Informatik: 1.303
  • Chemie: 1.102
  • Physik: 742
  • Literatur: 504
  • Geschichte: 422
  • Biologie: 383
  • Linguistik: 317

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp