Command Palette
Search for a command to run...
FGN:中国語固有表現認識のためのフュージョングリフネットワーク
FGN:中国語固有表現認識のためのフュージョングリフネットワーク
Zhenyu Xuan Rui Bao Shengyi Jiang
概要
中国語固有名詞抽出(Chinese NER)は困難なタスクである。漢字は表意文字であるため、潜在的な文字形状情報(glyph information)を内包しているが、これについてはしばしば無視されがちである。本論文では、中国語NERを対象に、文字形状情報を統合する「FGN(Fusion Glyph Network)」を提案する。本手法は文字形状情報を付加するだけでなく、統合機構を用いて追加の相互作用情報も導入可能である。FGNの主な革新点は以下の通りである:(1)隣接する文字間の文字形状情報およびその相互作用を同時に捉えるために、新規のCNN構造であるCGS-CNNを提案する。(2)文字ごとのBERT表現と文字形状表現を統合するため、スライディングウィンドウとSlice-Attentionを用いた手法を導入し、文脈と文字形状の間に潜在的な相互作用知識を捉える可能性を高める。本研究では4つのNERデータセット上で実験を行い、FGNにLSTM-CRFをタガーとして用いた場合、中国語NERにおいて新たなSOTA(State-of-the-Art)性能を達成した。さらに、FGN内の各種モジュールおよび設定が性能に与える影響を詳細に検証するための追加実験も実施した。