12日前

自己注意メカニズムを用いた敵対的転移学習による中国語固有名詞認識

{Yubo Chen, Pengfei Cao, Jun Zhao, Shengping Liu, Kang Liu}
自己注意メカニズムを用いた敵対的転移学習による中国語固有名詞認識
要約

名前付きエンティティ抽出(Named Entity Recognition, NER)は自然言語処理分野における重要なタスクであり、対象となるエンティティの境界を特定し、事前に定義されたカテゴリに分類する必要がある。中国語NERタスクにおいては、注釈付きデータが極めて限られている。中国語NERタスクと中国語単語分割(Chinese Word Segmentation, CWS)タスクは、多くの点で類似した語彙境界を共有している一方で、それぞれに固有の特徴も存在する。しかし、従来の中国語NER手法は、CWSから得られる語境界情報を十分に活用していないか、あるいはCWS特有の情報を適切にフィルタリングできないという課題を抱えている。本論文では、タスク間で共有される境界情報の活用を最大化するとともに、CWS固有の特徴を抑制するため、新たな敵対的転移学習フレームワークを提案する。さらに、エンティティタイプを予測する際に任意の文字が重要な手がかりとなることから、自己注意機構(self-attention)を用いて2つのトークン間の長距離依存関係を明示的に捉える。2つの広く用いられている異なるデータセットにおける実験結果から、本研究で提案するモデルが、他の最先端手法と比較して顕著かつ一貫して優れた性能を発揮することが示された。

自己注意メカニズムを用いた敵対的転移学習による中国語固有名詞認識 | 最新論文 | HyperAI超神経