2ヶ月前
BoningKnife: 先行境界知識を用いたネストされたNERのための統合エンティティ認識とタイプ付け
Huiqiang Jiang; Guoxin Wang; Weile Chen; Chengxi Zhang; Börje F. Karlsson

要約
名詞エンティティ認識(NER)は自然言語処理の重要なタスクであるが、多くのアプローチはフラットなエンティティのみを対象としており、多くのシナリオで一般的に見られるネスト構造を無視している。既存のネスト型NER手法の大部分は、すべての部分列を走査するため高コストかつ非効率的であり、また境界知識というネスト型エンティティにとって重要な要素を十分に考慮していない。本論文では、事前境界知識を活用した共同エンティティメンション検出とタイプ分類モデル(BoningKnife)を提案し、ネスト型NERの抽出および認識タスクをより適切に処理することを目指す。BoningKnifeはMentionTaggerとTypeClassifierの2つのモジュールから構成される。MentionTaggerはエンティティの開始/終了だけでなく境界知識をより効果的に活用することで、ネストレベルや長いスパンの扱いを改善し、高品質なメンション候補を生成する。TypeClassifierは2段階の注意メカニズムを利用し、異なるネストレベル表現を分離し、エンティティタイプを見分けやすくする。両モジュールは共通表現と新しいデュアル情報注意層を共有して共同訓練され、これによりエンティティ関連情報をより正確に捉える表現が得られる。異なるデータセットでの実験結果から、当手法が従来の最先端手法よりも優れており、ACE2004, ACE2005, NNEにおいてそれぞれ86.41, 85.46, 94.2のF1スコアを達成することが示された。