HyperAIHyperAI
il y a 2 mois

Résolution de problèmes mathématiques par génération de variants linguistiques des énoncés de problèmes

Syed Rifat Raiyan; Md. Nafis Faiyaz; Shah Md. Jawad Kabir; Mohsinul Kabir; Hasan Mahmud; Md Kamrul Hasan
Résolution de problèmes mathématiques par génération de variants linguistiques des énoncés de problèmes
Résumé

L'art du raisonnement mathématique constitue un pilier fondamental du progrès intellectuel et est un catalyseur central pour l'éveil de l'ingéniosité humaine. Des chercheurs ont récemment publié une abondance d'ouvrages axés sur la tâche de résolution de problèmes mathématiques en langage naturel (MWP) $-$ une avancée cruciale vers l'IA générale. Ces modèles existants sont vulnérables à une dépendance aux heuristiques superficielles et aux corrélations spurieuses pour dériver les expressions de solutions. Afin d'améliorer cette situation, dans cet article, nous proposons un cadre pour les solveurs MWP basé sur la génération de variantes linguistiques du texte du problème. Cette approche consiste à résoudre chacune des variantes du problème et à sélectionner l'expression prédite qui obtient la majorité des votes. Nous utilisons DeBERTa (Decoding-enhanced BERT with disentangled attention) comme encodeur afin de tirer parti de ses représentations textuelles riches et de son décodeur masqué amélioré pour construire les expressions de solutions. De plus, nous introduisons un ensemble de données complexe, $\mathrm{P\small{ARA}\normalsize{MAWPS}}$, composé de variantes paraphrasées, adversaires et inverses de problèmes MWP sélectionnés provenant du jeu de données référence $\mathrm{M\small{AWPS}}$. Nous menons des expériences approfondies sur cet ensemble de données ainsi que sur d'autres jeux de données référence en utilisant certains modèles solveurs MWP basiques. Nous montrons que l'entraînement sur des variantes linguistiques des énoncés des problèmes et le vote sur les prédictions candidates améliorent le raisonnement mathématique et la robustesse du modèle. Nous rendons notre code et nos données publiquement disponibles.