HyperAIHyperAI

Command Palette

Search for a command to run...

Avancer vers l’extrémité longue du sens des mots en désambiguisation avec des bi-encodeurs informés par des glosses

Luke Zettlemoyer Terra Blevins

Résumé

Un obstacle majeur en détermination du sens des mots (WSD) réside dans le fait que les sens des mots ne sont pas uniformément répartis, ce qui entraîne une performance généralement médiocre des modèles existants sur les sens rares ou inconnus durant l'entraînement. Nous proposons un modèle bi-encodeur qui encode indépendamment : (1) le mot cible avec son contexte environnant, et (2) la définition du dictionnaire, ou gloss, correspondant à chaque sens. Les deux encodeurs sont optimisés conjointement dans un même espace de représentation, permettant ainsi la désambiguïsation du sens par recherche du vecteur de sens le plus proche pour chaque vecteur de mot cible. Notre système surpasser les modèles d’état de l’art précédents sur le WSD anglais pour tous les mots ; ces améliorations proviennent principalement d’une meilleure performance sur les sens rares, entraînant une réduction de 31,1 % de l’erreur sur les sens moins fréquents par rapport aux travaux antérieurs. Cela démontre que les sens rares peuvent être mieux désambiguïsés en modélisant leurs définitions.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp