7日前

外部コンテキストの取得と協調学習を用いた命名エンティティ認識の改善

Xinyu Wang, Yong Jiang, Nguyen Bach, Tao Wang, Zhongqiang Huang, Fei Huang, Kewei Tu
外部コンテキストの取得と協調学習を用いた命名エンティティ認識の改善
要約

近年の固有表現抽出(Named Entity Recognition, NER)の進展により、文書レベルの文脈がモデル性能を顕著に向上させることを示す研究が多数報告されている。しかし、多くの実用的応用場面では、このような文書全体の文脈が利用可能ではない。本研究では、元の文をクエリとして検索エンジンを用いて意味的に関連する複数の外部テキストを検索・選定し、その文の外部文脈を自動的に取得する手法を提案する。実証的に、元の文とその外部文脈を連結して構築した「検索ベースの入力ビュー」に対して計算される文脈表現は、単一の文に基づく従来の入力ビューに比べ、著しく高い性能を達成することを確認した。さらに、二つの入力ビュー(元の文のみ、および元の文と外部文脈の連結)が類似した文脈表現または出力ラベル分布を生成するよう促す「協調学習(Cooperative Learning)」という訓練手法を導入することで、両方の入力ビューのモデル性能をさらに向上させられることが示された。実験の結果、本手法は5つの異なるドメインにまたがる8つのNERデータセットにおいて、新たなSOTA(State-of-the-Art)性能を達成した。