HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Du Problème d'inférence Open-RL

Date

il y a 5 heures

Licence

MIT

OpenRL est un ensemble de données de problèmes de raisonnement multidomaines publié par Turing en 2026. Il contient des problèmes de raisonnement STEM indépendants, vérifiables et explicites en physique, mathématiques, biologie et chimie. Chaque problème requiert un raisonnement en plusieurs étapes, implique des opérations symboliques et/ou des calculs numériques, et possède une réponse finale objectivement vérifiable. Cet ensemble de données convient à l'ajustement fin de l'apprentissage par renforcement, à la modélisation des récompenses, à l'entraînement supervisé par les résultats et à l'évaluation comparative du raisonnement vérifiable.

Champs de données:

  • conversation_id : Un identifiant unique pour chaque paire question-réponse
  • domaine : Le champ d'études (physique, mathématiques, chimie, biologie)
  • sous-domaine : Sujet spécifique
  • Question : Support STEM pour LaTeX – Description du problème
  • Réponse : Une réponse définitive et standard

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp