Intégration des glossaires dans la désambiguïsation sémantique des mots par réseau neuronal

La désambiguïsation sémantique des mots (Désambiguïsation Sémantique des Mots, DSM) vise à identifier le sens correct des mots polysèmes dans un contexte spécifique. Les ressources lexicales comme WordNet ont été prouvées être d'une grande utilité pour la DSM dans les méthodes basées sur les connaissances. Cependant, les réseaux neuronaux précédents pour la DSM dépendaient toujours de grandes quantités de données étiquetées (contexte), ignorant les ressources lexicales telles que les définitions de sens (glosses). Dans cet article, nous intégrons le contexte et les glosses du mot cible dans un cadre unifié afin d'exploiter pleinement à la fois les données étiquetées et les connaissances lexicales. Ainsi, nous proposons GAS : un réseau neuronal de DSM augmenté par des glosses qui encode conjointement le contexte et les glosses du mot cible. GAS modélise la relation sémantique entre le contexte et la gloss dans un cadre amélioré de réseau mémoire, ce qui rompt les barrières des méthodes supervisées et basées sur les connaissances précédentes. Nous enrichissons davantage l'information des glosses en utilisant leurs relations sémantiques dans WordNet. Les résultats expérimentaux montrent que notre modèle surpassent les systèmes de pointe sur plusieurs jeux de données anglais de DSM pour tous les mots.