HyperAIHyperAI
il y a 2 mois

Désambiguïcation semi-supervisée du sens des mots avec des modèles neuronaux

Dayu Yuan; Julian Richardson; Ryan Doherty; Colin Evans; Eric Altendorf
Désambiguïcation semi-supervisée du sens des mots avec des modèles neuronaux
Résumé

La détermination du sens visé des mots dans un texte – la désambiguïsation lexicale (WSD) – est un problème de longue date en traitement automatique des langues naturelles. Récemment, des chercheurs ont montré des résultats prometteurs en utilisant les vecteurs de mots extraits d'un modèle de langage neuronal comme caractéristiques dans les algorithmes de WSD. Cependant, une simple moyenne ou concaténation des vecteurs de mots pour chaque mot dans un texte fait perdre l'information séquentielle et syntaxique du texte. Dans cet article, nous étudions la WSD à l'aide d'un réseau neuronal pour l'apprentissage séquentiel, le LSTM, afin de mieux capturer les motifs séquentiels et syntaxiques du texte. Pour atténuer le manque de données d'entraînement en WSD sur tous les mots, nous utilisons le même LSTM dans un classifieur de propagation d'étiquettes semi-supervisé. Nous démontrons des résultats à l'état de l'art, particulièrement sur les verbes.