Command Palette
Search for a command to run...
Ensemble De Données Du Problème d'inférence Open-RL
OpenRL est un ensemble de données de problèmes de raisonnement multidomaines publié par Turing en 2026. Il contient des problèmes de raisonnement STEM indépendants, vérifiables et explicites en physique, mathématiques, biologie et chimie. Chaque problème requiert un raisonnement en plusieurs étapes, implique des opérations symboliques et/ou des calculs numériques, et possède une réponse finale objectivement vérifiable. Cet ensemble de données convient à l'ajustement fin de l'apprentissage par renforcement, à la modélisation des récompenses, à l'entraînement supervisé par les résultats et à l'évaluation comparative du raisonnement vérifiable.
Champs de données:
- conversation_id : Un identifiant unique pour chaque paire question-réponse
- domaine : Le champ d'études (physique, mathématiques, chimie, biologie)
- sous-domaine : Sujet spécifique
- Question : Support STEM pour LaTeX – Description du problème
- Réponse : Une réponse définitive et standard
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.