HyperAIHyperAI
vor 11 Tagen

FGN: Fusion Glyph Network für die Erkennung von chinesischen Eigennamen

Zhenyu Xuan, Rui Bao, Shengyi Jiang
FGN: Fusion Glyph Network für die Erkennung von chinesischen Eigennamen
Abstract

Die Erkennung von benannten Entitäten (NER) im Chinesischen stellt eine herausfordernde Aufgabe dar. Da chinesische Schriftzeichen als Piktogramme gelten, enthalten sie latente glyphenhafte Informationen, die häufig übersehen werden. In diesem Artikel stellen wir das FGN, ein Fusion Glyph Network für die chinesische NER, vor. Neben der Einbeziehung glyphenhafter Informationen ermöglicht diese Methode durch den Fusionsmechanismus auch die Integration zusätzlicher interaktiver Informationen. Die zentralen Innovationen des FGN sind: (1) die Einführung einer neuen CNN-Architektur namens CGS-CNN, die sowohl glyphenhafte Informationen als auch interaktive Beziehungen zwischen benachbarten Zeichen erfassen kann. (2) eine Methode, die einen gleitenden Fensteransatz und Slice-Attention nutzt, um die BERT-Darstellung und die glyphenhafte Darstellung eines Zeichens zu fusionieren, wodurch potenzielle interaktive Kenntnisse zwischen Kontext und Glyphen erfasst werden können. Experimente wurden auf vier NER-Datensätzen durchgeführt, wobei FGN mit LSTM-CRF als Tagger neue SOTA-Ergebnisse für die chinesische NER erzielt. Zusätzlich wurden weitere Experimente durchgeführt, um die Auswirkungen verschiedener Komponenten und Einstellungen im FGN zu untersuchen.

FGN: Fusion Glyph Network für die Erkennung von chinesischen Eigennamen | Neueste Forschungsarbeiten | HyperAI