HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Date

il y a 3 heures

URL du document

2603.00889

Licence

Apache 2.0

CHIMERA est un jeu de données d'inférence synthétique conçu spécifiquement pour l'entraînement à l'inférence ; les articles de recherche associés incluent… CHIMERA : Données synthétiques compactes pour un raisonnement LLM généralisable Cet ensemble de données couvre un large éventail de sujets STEM et fournit des trajectoires de pensée à longue chaîne (CoT).

Cet ensemble de données contient 9 225 questions réparties en 8 disciplines (mathématiques, informatique, chimie, physique, littérature, histoire, biologie et phonétique). Tous les exemples sont générés par un modèle de langage étendu (LLM) et validés automatiquement, sans annotation manuelle.

Répartition des disciplines:

  • Mathématiques : 4 452
  • Informatique : 1 303
  • Chimie : 1 102
  • Physique : 742
  • Littérature : 504
  • Historique : 422
  • Biologie : 383
  • Linguistique : 317

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp