HyperAI

Ensemble De Données D'inférence SynLogic

Date

il y a 6 jours

Organisation

URL de publication

huggingface.co

Catégories

Aide au téléchargement

SynLogic est un ensemble complet de données de raisonnement logique synthétique, publié en 2025 par l'Université des sciences et technologies de Hong Kong et l'équipe de recherche MiniMax. Les résultats de l'étude sont les suivants :SynLogic : Synthétiser des données de raisonnement vérifiables à grande échelle pour l'apprentissage du raisonnement logique et au-delà", qui vise à améliorer la capacité de raisonnement logique des grands modèles de langage (LLM) grâce à l'apprentissage par renforcement avec des récompenses vérifiables.

L'ensemble de données contient 35 tâches de raisonnement logique diverses et dispose de capacités de validation automatique, ce qui le rend parfaitement adapté à la formation par renforcement.

Caractéristiques principales

  • 35 types de tâches : y compris Sudoku, jeux à 24 points, mots de passe, labyrinthes fléchés, puzzles arithmétiques, etc.
  • Bonus vérifiable : tous les échantillons disposent d'un vérificateur automatique pour vérifier leur exactitude
  • Difficulté contrôlable : chaque tâche a des paramètres de difficulté réglables
  • Deux versions : version facile (pour le modèle 7B) et version difficile (pour le modèle 32B)

Configuration du jeu de données

SynLogic-Easy

  • Cible: Modèle de paramètres 7B
  • Tâche: 27 missions
  • échantillon:Environ 16 000 instances de formation

SynLogic-Dur

  • CibleModèle de paramètres 32B
  • Tâche: Les 35 tâches
  • échantillon:Environ 33 000 instances de formation