HyperAIHyperAI
il y a 2 mois

Amélioration de la couverture et de la capacité de généralisation du désambiguïsation sémantique des mots par les relations d'hyperonymie et d'hyponymie

Loïc Vial; Benjamin Lecouteux; Didier Schwab
Amélioration de la couverture et de la capacité de généralisation du désambiguïsation sémantique des mots par les relations d'hyperonymie et d'hyponymie
Résumé

Dans le domaine de la Détermination du Sens des Mots (Word Sense Disambiguation, WSD), l'approche prédominante consiste généralement en un système supervisé formé sur des corpus annotés par sens. Cependant, la quantité limitée de tels corpus restreint la couverture et les performances de ces systèmes. Dans cet article, nous proposons une nouvelle méthode qui résout ces problèmes en exploitant les connaissances présentes dans WordNet, et plus particulièrement les relations d'hyperonymie et d'hyponymie entre les synsets, afin de réduire le nombre de balises de sens différentes nécessaires pour désambiguïser tous les mots de la base lexicales. Notre méthode conduit à des résultats d'état de l'art sur la plupart des tâches d'évaluation en WSD, tout en améliorant la couverture des systèmes supervisés, réduisant le temps d'entraînement et la taille des modèles, sans données d'entraînement supplémentaires. De plus, nous présentons des résultats qui surpassent significativement l'état de l'art lorsque notre méthode est combinée avec une technique d'ensemblage et l'ajout du corpus WordNet Gloss Tagged comme données d'entraînement.

Amélioration de la couverture et de la capacité de généralisation du désambiguïsation sémantique des mots par les relations d'hyperonymie et d'hyponymie | Articles de recherche récents | HyperAI