HyperAIHyperAI
il y a 2 mois

Une Base de Référence Simplement Efficace mais Puissante pour la Reconnaissance de Noms Propres Emboîtés

Hang Yan; Yu Sun; Xiaonan Li; Xipeng Qiu
Une Base de Référence Simplement Efficace mais Puissante pour la Reconnaissance de Noms Propres Emboîtés
Résumé

La reconnaissance d'entités nommées (NER) est la tâche de détecter et classifier les segments d'entités dans le texte. Lorsque ces segments se chevauchent mutuellement, ce problème est connu sous le nom de NER imbriqué. Les méthodes basées sur les segments ont été largement utilisées pour aborder le NER imbriqué. La plupart de ces méthodes génèrent une matrice de scores $n \times n$, où $n$ représente la longueur de la phrase, et chaque entrée correspond à un segment. Cependant, les travaux antérieurs ignorent les relations spatiales dans la matrice de scores. Dans cet article, nous proposons d'utiliser un réseau neuronal convolutif (CNN) pour modéliser ces relations spatiales dans la matrice de scores. Bien que simple, nos expériences sur trois ensembles de données couramment utilisés pour le NER imbriqué montrent que notre modèle dépasse plusieurs méthodes récemment proposées avec les mêmes encodeurs pré-entraînés. Une analyse supplémentaire révèle que l'utilisation d'un CNN peut aider le modèle à identifier davantage d'entités imbriquées. De plus, nous avons constaté que différents articles utilisaient différentes tokenisations des phrases pour les trois ensembles de données de NER imbriqué, ce qui peut influencer les comparaisons. Par conséquent, nous mettons à disposition un script de prétraitement afin de faciliter les comparaisons futures.

Une Base de Référence Simplement Efficace mais Puissante pour la Reconnaissance de Noms Propres Emboîtés | Articles de recherche récents | HyperAI