Ensemble De Données De Raisonnement Mathématique OpenR1-Math-220k
Date
il y a 2 mois
Taille
3.51 GB
URL de publication
Licence
Apache 2.0
OpenR1-Math-220k est un ensemble de données de raisonnement mathématique à grande échelle publié par l'équipe Open R1 en 2025 pour combler le vide dans les données synthétiques DeepSeek R1. L'ensemble de données contient 220 000 problèmes mathématiques de haute qualité et leurs trajectoires de raisonnement, qui sont dérivées de 800 000 trajectoires de raisonnement générées par DeepSeek R1.
L'ensemble de données est divisé en deux parties :
- par défaut (94 000 problèmes):Cette partie des données fonctionne mieux après un réglage fin supervisé (SFT).
- étendu (131 000 questions):Cette partie des données contient des sources de données NuminaMath 1.5 supplémentaires, telles que cn_k12, qui fournissent davantage de formules d'inférence.
OpenR1-Math-220k.torrent
Partage 0Téléchargement 1Terminés 29Téléchargements totaux 57