HyperAIHyperAI
il y a 2 mois

Sequence-to-Nuggets : Détection de mentions d'entités imbriquées via des réseaux de régions-ancres

Hongyu Lin; Yaojie Lu; Xianpei Han; Le Sun
Sequence-to-Nuggets : Détection de mentions d'entités imbriquées via des réseaux de régions-ancres
Résumé

Les approches de reconnaissance d'entités nommées (NER) basées sur l'étiquetage séquentiel restreignent chaque mot à n'appartenir qu'à une seule mention d'entité au maximum, ce qui pose un problème sérieux lors de la reconnaissance des mentions d'entités imbriquées. Dans cet article, nous proposons de résoudre ce problème en modélisant et en exploitant les structures phrastiques dirigées par le mot tête des mentions d'entités, c'est-à-dire que bien qu'une mention puisse contenir d'autres mentions, elles ne partageront pas le même mot tête. Plus précisément, nous proposons les réseaux Anchor-Region (ARNs), une architecture de séquence à nuggets pour la détection de mentions imbriquées. Les ARNs identifient d'abord les mots ancre (c'est-à-dire les mots tête potentiels) de toutes les mentions, puis reconnaissent les limites des mentions pour chaque mot ancre en exploitant des structures phrastiques régulières. De plus, nous avons également conçu la perte Bag (Bag Loss), une fonction objectif qui peut entraîner les ARNs de manière end-to-end sans utiliser aucune annotation de mots ancre. Les expériences montrent que les ARNs atteignent des performances de pointe sur trois benchmarks standard de détection de mentions d'entités imbriquées.

Sequence-to-Nuggets : Détection de mentions d'entités imbriquées via des réseaux de régions-ancres | Articles de recherche récents | HyperAI