Un seul réseau LSTM bidirectionnel profond pour la désambiguïsation sémantique des mots dans les données textuelles

En raison des récentes avancées techniques et scientifiques, nous disposons d'une abondance d'informations cachées dans des données textuelles non structurées, telles que des récits hors ligne/en ligne, des articles de recherche et des rapports cliniques. Pour exploiter ces données de manière appropriée, en tenant compte de leur ambiguïté inhérente, un algorithme de Détermination du Sens des Mots (Word Sense Disambiguation - WSD) peut éviter de nombreuses difficultés dans la chaîne de traitement du langage naturel (Natural Language Processing - NLP). Cependant, étant donné le grand nombre de mots ambigus dans une langue ou un domaine technique, nous pouvons rencontrer des contraintes limitantes pour le déploiement adéquat des modèles WSD existants. Ce papier tente d'aborder le problème des algorithmes WSD à un classificateur par mot en proposant un seul réseau Bidirectionnel à Mémoire à Court et Long Terme (Bidirectional Long Short-Term Memory - BLSTM), qui, en prenant en compte les sens et les séquences contextuelles, travaille sur tous les mots ambigus collectivement. Évalué sur la référence SensEval-3, nous montrons que les résultats de notre modèle sont comparables à ceux des meilleurs algorithmes WSD. Nous discutons également de la façon dont l'application de modifications supplémentaires atténue les erreurs du modèle et souligne la nécessité d'avoir plus de données d'entraînement.