HyperAIHyperAI
il y a 11 jours

FGN : Réseau de glyphes de fusion pour la reconnaissance des entités nommées chinoises

Zhenyu Xuan, Rui Bao, Shengyi Jiang
FGN : Réseau de glyphes de fusion pour la reconnaissance des entités nommées chinoises
Résumé

La reconnaissance d'entités nommées (NER) en chinois constitue une tâche particulièrement difficile. Étant donné que les caractères chinois sont des idéogrammes, ils contiennent des informations latentes liées à leur graphie, souvent négligées dans les approches existantes. Dans cet article, nous proposons FGN, un modèle appelé Fusion Glyph Network pour la NER chinoise. En plus d’intégrer des informations graphiques, cette méthode peut également incorporer des informations interactives supplémentaires grâce à un mécanisme de fusion. Les principales innovations de FGN sont les suivantes : (1) nous introduisons une nouvelle architecture CNN, nommée CGS-CNN, conçue pour capturer à la fois les informations graphiques et les interactions entre les graphies des caractères voisins ; (2) nous proposons une méthode basée sur une fenêtre glissante et une attention par découpage (Slice-Attention) pour fusionner les représentations BERT et les représentations graphiques d’un même caractère, permettant ainsi de capturer des connaissances potentielles d’interaction entre le contexte et la graphie. Des expériences ont été menées sur quatre jeux de données de NER, montrant que FGN, combiné à un classifieur LSTM-CRF, atteint de nouveaux états de l’art pour la NER chinoise. En outre, des études supplémentaires ont été réalisées afin d’analyser l’impact de divers composants et configurations au sein de FGN.

FGN : Réseau de glyphes de fusion pour la reconnaissance des entités nommées chinoises | Articles de recherche récents | HyperAI