il y a 3 mois

Avancer vers l’extrémité longue du sens des mots en désambiguisation avec des bi-encodeurs informés par des glosses

{Luke Zettlemoyer, Terra Blevins}

Résumé

Un obstacle majeur en détermination du sens des mots (WSD) réside dans le fait que les sens des mots ne sont pas uniformément répartis, ce qui entraîne une performance généralement médiocre des modèles existants sur les sens rares ou inconnus durant l'entraînement. Nous proposons un modèle bi-encodeur qui encode indépendamment : (1) le mot cible avec son contexte environnant, et (2) la définition du dictionnaire, ou gloss, correspondant à chaque sens. Les deux encodeurs sont optimisés conjointement dans un même espace de représentation, permettant ainsi la désambiguïsation du sens par recherche du vecteur de sens le plus proche pour chaque vecteur de mot cible. Notre système surpasser les modèles d’état de l’art précédents sur le WSD anglais pour tous les mots ; ces améliorations proviennent principalement d’une meilleure performance sur les sens rares, entraînant une réduction de 31,1 % de l’erreur sur les sens moins fréquents par rapport aux travaux antérieurs. Cela démontre que les sens rares peuvent être mieux désambiguïsés en modélisant leurs définitions.