Ensemble De Données SFT d'invite De Réglage Fin Supervisé PromptCoT-2.0-SFT-4.8M
Date
URL de publication
URL de l'article
Licence
MIT
PromptCoT-2.0-SFT-4.8M est un ensemble de données d'invite synthétiques à grande échelle publié par l'équipe de recherche de l'Université de Hong Kong et Ant Group en 2025. Les résultats de l'article associé sont «PromptCoT 2.0 : Synthèse d'invites à grande échelle pour le raisonnement sur des modèles de langage volumineux", qui vise à fournir un corpus d'invite de raisonnement de haute qualité pour les grands modèles de langage pour un réglage fin ou une autoformation.
L'ensemble de données contient environ 4,8 millions d'invites entièrement synthétiques avec des trajectoires de raisonnement dans des scénarios de réglage fin supervisés et d'auto-pratique, couvrant deux domaines majeurs du raisonnement : les mathématiques et la programmation.
Composition des données :
- Dans le scénario de réglage fin supervisé (SFT), un total de 4 766 890 invites ont été synthétisées, dont :
- 1 188 505 invites de tâches de programmation
- 3 578 385 questions de tâches mathématiques