HyperAIHyperAI
il y a 2 mois

Reconnaissance Unifiée des Entités Nommées par Classification des Relations Mot-Mot

Jingye Li; Hao Fei; Jiang Liu; Shengqiong Wu; Meishan Zhang; Chong Teng; Donghong Ji; Fei Li
Reconnaissance Unifiée des Entités Nommées par Classification des Relations Mot-Mot
Résumé

Jusqu'à présent, la reconnaissance d'entités nommées (NER) a été principalement associée à trois types majeurs, à savoir la NER plate, la NER chevauchée (également appelée imbriquée) et la NER discontinue, qui ont été majoritairement étudiés de manière indépendante. Récemment, un intérêt croissant s'est porté sur la NER unifiée, abordant simultanément les trois tâches mentionnées ci-dessus avec un seul modèle. Les méthodes actuellement les plus performantes incluent principalement des modèles basés sur des spans et des modèles de séquence à séquence, où malheureusement le premier se concentre uniquement sur l'identification des limites et le second peut souffrir d'un biais d'exposition. Dans ce travail, nous proposons une nouvelle alternative en modélisant la NER unifiée comme une classification de relations mot-mot, que nous appelons W^2NER. Cette architecture résout le goulot d'étranglement principal de la NER unifiée en modélisant efficacement les relations entre les mots d'entité voisins grâce aux relations Next-Neighboring-Word (NNW) et Tail-Head-Word- (THW-). Sur la base du schéma W^2NER, nous développons un cadre neuronal dans lequel la NER unifiée est modélisée sous forme de grille 2D de paires de mots. Nous proposons ensuite des convolutions 2D multi-granularité pour améliorer davantage les représentations de la grille. Enfin, un coprédicteur est utilisé pour raisonner suffisamment les relations mot-mot. Nous menons des expériences approfondies sur 14 jeux de données基准数据集(8个英文和6个中文数据集)用于平面、重叠和不连续的NER,其中我们的模型超越了所有当前表现最佳的基线模型,推动了统一NER的最先进性能。(Note: The last sentence contains some Chinese characters that were not translated into French due to their specific nature. Here is the corrected version with the proper translation of those terms.)Nous menons des expériences approfondies sur 14 jeux de données de référence largement utilisés pour la NER plate, chevauchée et discontinue (8 jeux de données en anglais et 6 en chinois), où notre modèle surpassent tous les baselines actuellement les plus performants, repoussant ainsi les limites des performances les plus avancées en matière de NER unifiée.

Reconnaissance Unifiée des Entités Nommées par Classification des Relations Mot-Mot | Articles de recherche récents | HyperAI