HyperAIHyperAI
il y a 11 jours

Apprentissage par la correction : Résolution de problèmes mathématiques à l’aide d’une supervision faible

Yining Hong, Qing Li, Daniel Ciao, Siyuan Huang, Song-Chun Zhu
Apprentissage par la correction : Résolution de problèmes mathématiques à l’aide d’une supervision faible
Résumé

Les solveurs neuronaux précédents des problèmes mathématiques à mots (MWPs) sont appris sous une supervision complète et échouent à générer des solutions diversifiées. Dans cet article, nous abordons cette limitation en introduisant un cadre d'apprentissage \textit{faiblement supervisé} pour les MWPs. Notre méthode n'exige que l'annotation des réponses finales et permet de générer plusieurs solutions différentes pour un même problème. Pour améliorer l'apprentissage faiblement supervisé, nous proposons un nouveau cadre \textit{d'apprentissage par correction} (LBF), qui corrige les malentendus du réseau neuronal grâce à un raisonnement symbolique. Plus précisément, pour un arbre de solution incorrect généré par le réseau neuronal, le mécanisme de \textit{correction} propage l'erreur du nœud racine aux nœuds feuilles et infère la correction la plus probable pouvant être exécutée afin d'obtenir la réponse souhaitée. Pour favoriser une plus grande diversité des solutions, une \textit{régularisation arborescente} est appliquée afin de guider efficacement la réduction et l'exploration de l'espace des solutions, tandis qu'un \textit{tampon mémoire} est conçu pour suivre et stocker les corrections diverses découvertes pour chaque problème. Les résultats expérimentaux sur le jeu de données Math23K montrent que le cadre LBF proposé surpasse significativement les méthodes de base basées sur l'apprentissage par renforcement dans le cadre d'une apprentissage faiblement supervisé. En outre, il atteint des performances comparables en précision au rang 1, ainsi qu'une précision bien supérieure au rang 3/5 par rapport aux méthodes entièrement supervisées, démontrant ainsi son efficacité dans la génération de solutions diversifiées.

Apprentissage par la correction : Résolution de problèmes mathématiques à l’aide d’une supervision faible | Articles de recherche récents | HyperAI