HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Def2Vec : Embeddings de mots extensibles à partir de définitions lexicographiques

{Roberto Tedesco Vincenzo Scotti Irene Morazzoni}

Def2Vec : Embeddings de mots extensibles à partir de définitions lexicographiques

Résumé

Def2Vec introduit un nouveau paradigme pour les embeddings de mots, en exploitant les définitions des dictionnaires afin d’apprendre des représentations sémantiques. En construisant des matrices terme-document à partir des définitions et en appliquant une Analyse Sémantique Latente (LSA), Def2Vec génère des embeddings offrant à la fois de fortes performances et une grande extensibilité. Dans des évaluations couvrant l’identification de partie du discours (POS), la reconnaissance d’entités nommées (NER), le découpage syntaxique (chunking) et la similarité sémantique, Def2Vec atteint souvent les performances des modèles de pointe tels que Word2Vec, GloVe et fastText, voire les dépasse parfois. La seconde matrice factorisée produite par la LSA permet une extension efficace des embeddings aux mots hors vocabulaire (out-of-vocabulary). En réconciliant efficacement les avantages des définitions de dictionnaire avec les embeddings basés sur la LSA, Def2Vec produit des représentations sémantiques informatives, particulièrement remarquables compte tenu de ses besoins réduits en données. Ce travail contribue à approfondir la compréhension de la génération d’embeddings de mots en intégrant des informations lexicologiques structurées et une extension d’embeddings efficace.

Benchmarks

BenchmarkMéthodologieMétriques
chunking-on-conll-2003Def2Vec
AUC: 93.07
Accuracy: 77.69
F1: 81.45
Precision: 86.56
Recall: 77.69
ner-on-conll-2003-1Def2Vec
AUC: 96.28
Accuracy: 71.98
F1: 83.09
Precision: 99.28
Recall: 71.98
semantic-textual-similarity-on-sts-benchmarkDef2Vec
Spearman Correlation: 0.6372

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Def2Vec : Embeddings de mots extensibles à partir de définitions lexicographiques | Articles de recherche | HyperAI