CAN-NER : Réseau de Convolution avec Attention pour la Reconnaissance des Entités Nommées en Chinois

La reconnaissance d'entités nommées (NER) en chinois est essentielle mais difficile en raison du manque de délimiteurs naturels. Par conséquent, la segmentation des mots chinois (CWS) est généralement considérée comme la première étape pour la NER en chinois. Cependant, les modèles basés sur des plongements (embeddings) au niveau des mots et des caractéristiques lexicographiques souffrent souvent d'erreurs de segmentation et de mots hors vocabulaire (OOV). Dans cet article, nous examinons un réseau de neurones à attention convolutive appelé CAN pour la NER en chinois, qui comprend un réseau neuronal convolutif (CNN) basé sur les caractères avec une couche d'attention locale et une unité récurrente à porte (GRU) avec une couche d'attention globale auto-appliquée pour capturer les informations provenant des caractères adjacents et des contextes de phrase. De plus, comparativement à d'autres modèles, notre modèle ne dépend d'aucune ressource externe telle que des lexicons et utilise des plongements de caractères de petite taille, ce qui le rend plus pratique. Des résultats expérimentaux approfondis montrent que notre approche surpassent les méthodes les plus avancées sans plongements de mots ni ressources lexicographiques externes sur différents jeux de données par domaine, y compris ceux du Weibo, du MSRA et du jeu de données NER pour les curriculum vitae chinois.