Architecture de reconnaissance d'entités nommées combinant des caractéristiques contextuelles et globales

La reconnaissance d'entités nommées (NER) est une technique d'extraction d'information visant à localiser et à classifier des entités nommées (par exemple, organisations, lieux, etc.) dans un document selon des catégories prédéfinies. L'identification correcte de ces expressions joue un rôle crucial dans la simplification de l'accès à l'information. Toutefois, cette tâche reste difficile en raison de la multiplicité des formes que peuvent prendre les entités nommées (NE) et de leur dépendance au contexte. Bien que le contexte puisse être représenté à l'aide de caractéristiques contextuelles, les modèles traditionnels peinent à capturer efficacement les relations globales entre les entités. Dans cet article, nous proposons une approche combinant des caractéristiques contextuelles issues de XLNet et des caractéristiques globales extraites par un Réseau de convolution sur graphe (GCN) afin d'améliorer les performances de la NER. Des expériences menées sur un jeu de données largement utilisé, CoNLL 2003, démontrent les avantages de notre stratégie, les résultats étant compétitifs avec les états de l'art (SOTA).