Un modèle hiérarchique neuronal pour la reconnaissance nommée imbriquée

Les mentions d'entités imbriquées dans des mentions d'entités plus longues sont appelées entités imbriquées. La plupart des systèmes de reconnaissance d'entités nommées (NER) traitent uniquement les entités plates et ignorent les entités imbriquées internes, ce qui empêche de capturer des informations sémantiques plus fines présentes dans les textes d'origine. Pour remédier à ce problème, nous proposons un nouveau modèle neuronal permettant de détecter les entités imbriquées en empilant dynamiquement des couches de NER plates. Chaque couche de NER plate repose sur un modèle de NER plat de pointe, qui capture la représentation contextuelle séquentielle à l'aide d'une couche bidirectionnelle à mémoire à court terme (LSTM) et la transmet à une couche CRF en cascade. Notre modèle fusionne la sortie de la couche LSTM de la couche de NER plate actuelle afin de construire une nouvelle représentation pour les entités détectées, puis alimente ces représentations dans la couche de NER plate suivante. Cette approche permet à notre modèle d'extraire les entités externes en tirant pleinement parti des informations encodées dans leurs entités internes correspondantes, selon une stratégie de traitement de l'intérieur vers l'extérieur. Le modèle empile dynamiquement les couches de NER plates jusqu'à ce qu'aucune entité externe supplémentaire ne soit détectée. Des évaluations étendues montrent que notre modèle dynamique surpasse les systèmes d'état de l'art basés sur des caractéristiques pour la NER imbriquée, obtenant respectivement 74,7 % et 72,2 % de score F sur les jeux de données GENIA et ACE2005.