Solveur universel structuré en arbre aligné sémantiquement pour les problèmes mathématiques à mots

Un solveur automatique pratique de problèmes mathématiques textuels (MWPs) devrait être capable de traiter divers types de MWPs, tandis que la plupart des travaux existants se concentrent uniquement sur les MWPs linéaires à une inconnue. Dans cet article, nous proposons une méthode simple mais efficace, appelée Arbre d'Expression Universel (UET), pour la première fois représenter de manière uniforme les équations correspondant à divers types de MWPs. Ensuite, nous introduisons un solveur structuré en arbre universel et sémantiquement aligné (SAU-Solver), basé sur un cadre encodeur-décodeur, capable de résoudre plusieurs types de MWPs dans un modèle unifié, grâce à notre représentation UET. Le SAU-Solver génère explicitement un arbre d'expression universel en décidant quel symbole produire en fonction du sens sémantique des symboles déjà générés, mimant ainsi la manière dont un humain résout les MWPs. En outre, notre SAU-Solver intègre une nouvelle régularisation au niveau des sous-arbres, fondée sur un alignement sémantique, pour renforcer davantage les contraintes sémantiques et la rationalité de l’arbre d’expression généré, en s’appuyant sur les informations contextuelles. Enfin, afin de valider l’universalité de notre solveur et d’élargir les frontières de la recherche sur les MWPs, nous introduisons un nouveau jeu de données exigeant, nommé Hybrid Math Word Problems (HMWP), composé de trois types de MWPs. Les résultats expérimentaux sur plusieurs jeux de données de MWPs montrent que notre modèle est capable de résoudre une large gamme de MWPs universels et surpasser plusieurs modèles de pointe.