HyperAIHyperAI
il y a 11 jours

Localiser et étiqueter : un identificateur à deux étapes pour la reconnaissance nommée imbriquée

Yongliang Shen, Xinyin Ma, Zeqi Tan, Shuai Zhang, Wen Wang, Weiming Lu
Localiser et étiqueter : un identificateur à deux étapes pour la reconnaissance nommée imbriquée
Résumé

La reconnaissance d'entités nommées (NER) est une tâche largement étudiée en traitement du langage naturel. Les recherches traditionnelles en NER se limitent aux entités plates, en ignorant les entités imbriquées. Les méthodes basées sur les spans traitent la reconnaissance d'entités comme une tâche de classification de spans. Bien que ces méthodes possèdent une capacité intrinsèque à gérer la NER imbriquée, elles souffrent de coûts computationnels élevés, d'une négligence des informations de bornes, d'une utilisation insuffisante des spans partiellement correspondantes aux entités, ainsi que de difficultés dans la reconnaissance d'entités longues. Pour résoudre ces problèmes, nous proposons un identificateur d'entités en deux étapes. Dans un premier temps, nous générons des propositions de spans en filtrant et en effectuant une régression de bornes sur des spans initiales (seed spans) afin de localiser les entités, puis, dans un second temps, nous étiquetons les propositions de spans ajustées aux bornes avec leurs catégories correspondantes. Notre méthode exploite efficacement les informations de bornes des entités ainsi que celles des spans partiellement correspondantes durant l'entraînement. Grâce à la régression de bornes, il devient théoriquement possible de couvrir des entités de toute longueur, ce qui améliore la capacité à reconnaître les entités longues. En outre, de nombreuses spans initiales de faible qualité sont éliminées à la première étape, ce qui réduit la complexité temporelle de l'inférence. Des expériences sur des jeux de données de NER imbriquée montrent que notre méthode surpasser les modèles précédents de l'état de l'art.

Localiser et étiqueter : un identificateur à deux étapes pour la reconnaissance nommée imbriquée | Articles de recherche récents | HyperAI