HyperAIHyperAI
il y a 2 mois

Fusion et Étiquetage : Une nouvelle architecture de réseau neuronal pour l'NER emboîtée

Joseph Fisher; Andreas Vlachos
Fusion et Étiquetage : Une nouvelle architecture de réseau neuronal pour l'NER emboîtée
Résumé

La reconnaissance d'entités nommées (NER) est l'une des tâches les mieux étudiées en traitement automatique des langues naturelles. Cependant, la plupart des approches ne sont pas capables de gérer les structures imbriquées, qui sont courantes dans de nombreuses applications. Dans cet article, nous présentons une nouvelle architecture de réseau neuronal qui fusionne d'abord les jetons et/ou les entités en entités formant des structures imbriquées, puis étiquette chacune d'entre elles indépendamment. Contrairement aux travaux précédents, notre approche de fusion et d'étiquetage prédit des structures de segmentation à valeurs réelles plutôt que discrètes, ce qui lui permet de combiner les plongements (embeddings) de mots et d'entités imbriquées tout en conservant la différentiabilité. Nous évaluons notre approche en utilisant le Corpus ACE 2005, où elle atteint un F1 record de 74,6, amélioré encore avec des plongements contextuels (BERT) à 82,4, soit une amélioration globale d'environ 8 points F1 par rapport aux approches précédentes formées sur les mêmes données. De plus, nous la comparons aux BiLSTM-CRFs, l'approche dominante pour les structures NER plates, démontrant que sa capacité à prédire des structures imbriquées n'affecte pas les performances dans les cas plus simples.

Fusion et Étiquetage : Une nouvelle architecture de réseau neuronal pour l'NER emboîtée | Articles de recherche récents | HyperAI