HyperAIHyperAI

Ensemble De Données SFT d'invite De Réglage Fin Supervisé PromptCoT-2.0-SFT-4.8M

Date

il y a 6 jours

Organisation

L'Université de Hong Kong
Groupe de fourmis

URL de publication

huggingface.co

URL de l'article

2509.19894

Licence

MIT

Aide au téléchargement

PromptCoT-2.0-SFT-4.8M est un ensemble de données d'invite synthétiques à grande échelle publié par l'équipe de recherche de l'Université de Hong Kong et Ant Group en 2025. Les résultats de l'article associé sont «PromptCoT 2.0 : Synthèse d'invites à grande échelle pour le raisonnement sur des modèles de langage volumineux", qui vise à fournir un corpus d'invite de raisonnement de haute qualité pour les grands modèles de langage pour un réglage fin ou une autoformation.

L'ensemble de données contient environ 4,8 millions d'invites entièrement synthétiques avec des trajectoires de raisonnement dans des scénarios de réglage fin supervisés et d'auto-pratique, couvrant deux domaines majeurs du raisonnement : les mathématiques et la programmation.

Composition des données :

  • Dans le scénario de réglage fin supervisé (SFT), un total de 4 766 890 invites ont été synthétisées, dont :
    • 1 188 505 invites de tâches de programmation
    • 3 578 385 questions de tâches mathématiques