Amélioration du sens des mots par désambiguïsation avec des représentations de sens améliorées

Les systèmes actuels d’ambiguïté des sens des mots (WSD) supervisés de pointe (tels que GlossBERT ou les modèles bi-encodeurs) obtiennent des résultats étonnamment bons en ne s’appuyant que sur des modèles linguistiques pré-entraînés et des définitions courtes (ou glosses) des différents sens d’un mot. Bien que concises et intuitives, ces glosses ne constituent qu’une seule des nombreuses façons de transmettre des informations sur les sens des mots. Dans cet article, nous nous concentrons sur l’amélioration des représentations des sens en intégrant des synonymes, des exemples de phrases ou de phrases illustrant l’usage des sens, ainsi que les glosses des hyperonymes. Nous démontrons que l’incorporation de ces informations supplémentaires améliore significativement les performances en WSD. Grâce aux améliorations proposées, notre système atteint un score F1 de 82,0 % sur le jeu de données de référence standard de la tâche anglaise de WSD sur tous les mots, surpassant ainsi tous les scores publiés précédemment sur ce benchmark.