Exploiter les connaissances lexicales pour la reconnaissance d'entités nommées chinoises via un réseau graphique collaboratif

Le manque d'informations sur les frontières des mots est considéré comme l'une des principales difficultés pour développer un système de reconnaissance d'entités nommées (NER) chinoise à haut rendement. Heureusement, le lexique automatiquement construit contient une information riche tant sur les frontières des mots que sur leur sémantique. Toutefois, l'intégration des connaissances lexicales dans les tâches de NER chinoise soulève encore des défis, notamment lorsqu'il s'agit de mots lexicaux qui s'auto-correspondent ou de mots lexicaux contextuels les plus proches. Nous proposons un Réseau Graphique Collaboratif afin de surmonter ces difficultés. Les expériences menées sur divers jeux de données montrent que notre modèle non seulement dépasse les résultats actuels de l'art (SOTA), mais atteint également une vitesse de traitement de six à quinze fois supérieure à celle du modèle SOTA.