HyperAIHyperAI
il y a 2 mois

Compression du vocabulaire des sens grâce aux connaissances sémantiques de WordNet pour la désambiguïsation des sens des mots par les réseaux neuronaux

Loïc Vial; Benjamin Lecouteux; Didier Schwab
Compression du vocabulaire des sens grâce aux connaissances sémantiques de WordNet pour la désambiguïsation des sens des mots par les réseaux neuronaux
Résumé

Dans cet article, nous abordons le problème de la quantité limitée de corpus manuellement annotés en sens pour la tâche de désambiguïsation lexicale (word sense disambiguation), en exploitant les relations sémantiques entre les sens, telles que la synonymie, l'hyperonymie et l'hyponymie, afin de réduire le vocabulaire des sens dans le Princeton WordNet. Cette compression permet ainsi de diminuer le nombre de différentes étiquettes de sens nécessaires pour désambiguïser tous les mots de la base lexicales. Nous proposons deux méthodes distinctes qui réduisent considérablement la taille des modèles neuronaux de désambiguïsation lexicale (WSD), tout en améliorant leur couverture sans nécessiter d'ajouter des données d'entraînement supplémentaires et sans affecter leur précision. En complément, nous présentons un système de désambiguïsation lexicale qui utilise des vecteurs de mots BERT pré-entraînés pour obtenir des résultats qui surpassent significativement l'état de l'art sur toutes les tâches d'évaluation de la désambiguïsation lexicale.

Compression du vocabulaire des sens grâce aux connaissances sémantiques de WordNet pour la désambiguïsation des sens des mots par les réseaux neuronaux | Articles de recherche récents | HyperAI