HyperAIHyperAI
il y a 16 jours

La Sparsité a du Sens : Désambiguïsation des Sens des Mots à l’aide de Représentations Lexicales Contextuelles Éparses

{G{\'a}bor Berend}
La Sparsité a du Sens : Désambiguïsation des Sens des Mots à l’aide de Représentations Lexicales Contextuelles Éparses
Résumé

Dans cet article, nous démontrons qu’en utilisant des représentations de mots creuses, il devient possible de dépasser les performances des modèles plus complexes spécifiques à une tâche sur la tâche de désambiguïsation des sens des mots à un niveau fin (fine-grained all-words word sense disambiguation). L’algorithme que nous proposons repose sur un ensemble surcomplet de vecteurs de base sémantiques, ce qui nous permet d’obtenir des représentations contextuelles creuses des mots. Nous introduisons une représentation de synset inspirée par la théorie de l’information, fondée sur les co-occurrences de sens de mots et les coordonnées non nulles des formes lexicales, permettant d’atteindre un score F global de 78,8 sur une combinaison de cinq jeux de données standards pour la désambiguïsation des sens des mots. Nous démontrons également la généralité de notre cadre proposé en l’évaluant sur la tâche d’identification des catégories grammaticales (part-of-speech tagging) sur quatre grammaires différentes (treebanks). Nos résultats indiquent une amélioration significative par rapport à l’application de représentations de mots denses.

La Sparsité a du Sens : Désambiguïsation des Sens des Mots à l’aide de Représentations Lexicales Contextuelles Éparses | Articles de recherche récents | HyperAI