Réévaluation neuronale pour la reconnaissance d'entités nommées

Nous proposons un système de réévaluation neuronale pour la reconnaissance d'entités nommées (NER). L'idée de base est d'utiliser des modèles de réseaux neuronaux récurrents pour apprendre les motifs au niveau des phrases impliquant des mentions d'entités nommées. Plus précisément, étant donné une phrase de sortie produite par un modèle NER de base, nous remplaçons toutes les mentions d'entités, telles que \textit{Barack Obama}, par leurs types d'entités, tels que \textit{PER}. Les motifs de phrases résultants contiennent des informations de sortie directes, mais sont moins éparse sans entités nommées spécifiques. Par exemple, « PER est né(e) en LOC » peut être un tel motif. Les structures LSTM et CNN sont utilisées pour apprendre des représentations profondes de ces phrases afin de les réévaluer. Les résultats montrent que notre système peut améliorer significativement les précisions NER par rapport à deux différents modèles de base, obtenant ainsi les meilleurs résultats signalés sur un banc d'essai standard.