HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage du raisonnement en plusieurs étapes par la résolution de tâches arithmétiques

Tianduo Wang Wei Lu

Résumé

Le raisonnement mathématique est considéré comme une capacité essentielle pour les modèles linguistiques (LM). Des travaux récents démontrent les performances remarquables des grands modèles linguistiques dans la résolution de problèmes mathématiques. Ce succès est attribué à leur capacité de raisonnement en chaîne de pensée (Chain-of-Thought, CoT), c’est-à-dire la capacité à décomposer des questions complexes en chaînes de raisonnement étape par étape, mais cette capacité semble ne se manifester que chez des modèles dotés d’un grand nombre de paramètres. Ce travail explore comment intégrer cette capacité de raisonnement multi-étapes à des modèles linguistiques relativement petits. Nous proposons d’injecter cette capacité en pré-entraînant continuellement les modèles sur un jeu de données synthétiques, MsAT, composé de tâches arithmétiques à plusieurs étapes. Nos expériences menées sur quatre jeux de données de problèmes mathématiques à énoncé montrent l’efficacité de la méthode proposée pour renforcer les capacités de raisonnement mathématique des modèles linguistiques.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Apprentissage du raisonnement en plusieurs étapes par la résolution de tâches arithmétiques | Articles | HyperAI