Amélioration de la reconnaissance d'entités nommées par un ensemble attentif d'informations syntaxiques

La reconnaissance d'entités nommées (NER) est fortement sensible aux propriétés syntaxiques et sémantiques des phrases, les entités pouvant être extraites en fonction de leur usage et de leur position dans le texte continu. Pour modéliser ces propriétés, on peut s'appuyer sur des ressources existantes afin d'apporter des connaissances utiles à la tâche de NER ; certaines études antérieures ont démontré l'efficacité de cette approche, mais elles restent limitées dans leur capacité à exploiter adéquatement ces connaissances, notamment en distinguant celles qui sont pertinentes dans un contexte donné. Dans cet article, nous améliorons la NER en exploitant différents types d'information syntaxique grâce à un ensemble attentif, fonctionnalisé par des réseaux de mémoire clé-valeur proposés, une attention syntaxique, et un mécanisme de porte pour respectivement encoder, pondérer et agréger ces informations syntaxiques. Les résultats expérimentaux sur six jeux de données de référence en anglais et en chinois montrent l'efficacité du modèle proposé, et indiquent qu'il surpasse les approches antérieures sur l'ensemble des jeux de données expérimentaux.