HyperAIHyperAI

Command Palette

Search for a command to run...

Compression du vocabulaire des sens grâce aux connaissances sémantiques de WordNet pour la désambiguïsation des sens des mots par les réseaux neuronaux

Loïc Vial Benjamin Lecouteux Didier Schwab

Résumé

Dans cet article, nous abordons le problème de la quantité limitée de corpus manuellement annotés en sens pour la tâche de désambiguïsation lexicale (word sense disambiguation), en exploitant les relations sémantiques entre les sens, telles que la synonymie, l'hyperonymie et l'hyponymie, afin de réduire le vocabulaire des sens dans le Princeton WordNet. Cette compression permet ainsi de diminuer le nombre de différentes étiquettes de sens nécessaires pour désambiguïser tous les mots de la base lexicales. Nous proposons deux méthodes distinctes qui réduisent considérablement la taille des modèles neuronaux de désambiguïsation lexicale (WSD), tout en améliorant leur couverture sans nécessiter d'ajouter des données d'entraînement supplémentaires et sans affecter leur précision. En complément, nous présentons un système de désambiguïsation lexicale qui utilise des vecteurs de mots BERT pré-entraînés pour obtenir des résultats qui surpassent significativement l'état de l'art sur toutes les tâches d'évaluation de la désambiguïsation lexicale.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Compression du vocabulaire des sens grâce aux connaissances sémantiques de WordNet pour la désambiguïsation des sens des mots par les réseaux neuronaux | Articles | HyperAI