Command Palette
Search for a command to run...
Ensemble De Données Synthétiques d'inférence Générale CHIMERA
Date
URL du document
Licence
Apache 2.0
CHIMERA est un jeu de données d'inférence synthétique conçu spécifiquement pour l'entraînement à l'inférence ; les articles de recherche associés incluent… CHIMERA : Données synthétiques compactes pour un raisonnement LLM généralisable Cet ensemble de données couvre un large éventail de sujets STEM et fournit des trajectoires de pensée à longue chaîne (CoT).
Cet ensemble de données contient 9 225 questions réparties en 8 disciplines (mathématiques, informatique, chimie, physique, littérature, histoire, biologie et phonétique). Tous les exemples sont générés par un modèle de langage étendu (LLM) et validés automatiquement, sans annotation manuelle.
Répartition des disciplines:
- Mathématiques : 4 452
- Informatique : 1 303
- Chimie : 1 102
- Physique : 742
- Littérature : 504
- Historique : 422
- Biologie : 383
- Linguistique : 317
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.