HyperAIHyperAI
il y a 11 jours

Génération d'équations par l'utilisation d'opérateurs : modèle GEO

{Gahgene Gweon, Bugeun Kim, Donggeon Lee, Kyung Seo Ki}
Génération d'équations par l'utilisation d'opérateurs : modèle GEO
Résumé

La résolution de problèmes mathématiques à partir de textes est un domaine de recherche émergent en traitement du langage naturel. Récemment, pour aborder la tâche de résolution de problèmes mathématiques, les chercheurs ont appliqué l’architecture encodeur-décodeur, principalement utilisée dans les tâches de traduction automatique. Les modèles neuronaux les plus avancés actuellement s’appuient sur des caractéristiques manuellement conçues et reposent sur des méthodes de génération. Dans cet article, nous proposons le modèle GEO (Generation of Equations by utilizing Operators), qui ne repose pas sur des caractéristiques manuellement conçues et qui traite deux problèmes présents dans les modèles neuronaux existants : 1. le manque de caractéristiques spécifiques au domaine, et 2. la perte des connaissances au niveau de l’encodeur. Pour résoudre le problème du manque de caractéristiques spécifiques au domaine, nous avons conçu deux tâches auxiliaires : la prédiction de la différence entre groupes d’opérations et la prédiction de paires implicites. Pour atténuer la perte de connaissances au niveau de l’encodeur, nous avons intégré une couche Feed Forward de caractéristiques d’opérations (OP3F). Les résultats expérimentaux montrent que le modèle GEO dépasse les modèles d’état de l’art existants sur deux jeux de données : 85,1 % sur MAWPS et 62,5 % sur DRAW-1K, tout en atteignant une performance comparable de 82,1 % sur le jeu de données ALG514.

Génération d'équations par l'utilisation d'opérateurs : modèle GEO | Articles de recherche récents | HyperAI