Pyramide : Un modèle hiérarchique pour la reconnaissance de entités nommées imbriquées

Cet article présente Pyramid, un nouveau modèle hiérarchique pour la reconnaissance des entités nommées imbriquées (nested NER). Dans notre approche, les embeddings de tokens ou de régions textuelles sont successivement introduits dans L couches NER plates, de bas en haut, empilées selon une forme de pyramide. À chaque passage à travers une couche de la pyramide, la longueur de l'embedding est réduite de un. L'état caché à la couche l représente un l-gramme dans le texte d'entrée, qui n'est étiqueté que si la région textuelle correspondante constitue une mention d'entité complète. Nous avons également conçu une pyramide inverse afin de permettre une interaction bidirectionnelle entre les couches. La méthode proposée atteint des scores F1 de pointe dans le domaine du nested NER sur les jeux de données ACE-2004, ACE-2005, GENIA et NNE, avec respectivement 80,27, 79,42, 77,78 et 93,70 pour des embeddings conventionnels, et 87,74, 86,34, 79,31 et 94,68 pour des embeddings contextuels pré-entraînés. En outre, notre modèle peut être appliqué à la tâche plus générale de reconnaissance des entités nommées chevauchantes. Une expérience préliminaire confirme l'efficacité de notre méthode dans le cadre de la reconnaissance des entités nommées chevauchantes.