11日前
ネストされた名前付きエンティティ認識のためのシーケンスツーセットネットワーク
Zeqi Tan, Yongliang Shen, Shuai Zhang, Weiming Lu, Yueting Zhuang

要約
命名エンティティ認識(Named Entity Recognition, NER)は、自然言語処理分野で広く研究されているタスクである。近年、ネスト構造を有するエンティティを扱う「ネスト型NER」に対する研究がますます増加している。スパンベースの手法は、エンティティ認識をスパン分類問題として捉えるため、ネスト構造を持つエンティティを自然に扱えるという利点を持つが、その一方で、探索空間が極めて大きくなるという問題と、エンティティ間の相互作用を十分に捉えられないという課題を抱えている。これらの問題に対処するために、本研究ではネスト型NER向けの新しいシーケンスから集合へのニューラルネットワークを提案する。事前に候補スパンを指定するのではなく、学習可能な固定ベクトルの集合を用いて、有用なスパンのパターンを学習する。また、非自己回帰的(non-autoregressive)なデコーダを採用することで、一度のパスで最終的なエンティティ集合を予測可能となり、エンティティ間の依存関係を効果的に捉えることができる。従来のシーケンス・トゥ・シーケンス(sequence-to-sequence)手法と比較して、本モデルはエンティティの順序に依存しないため、順序のない認識タスクに適している。さらに、二部マッチングに基づく損失関数を用いて全体の訓練損失を計算する。実験結果から、提案モデルはACE 2004、ACE 2005、KBP 2017の3つのネスト型NERコーパスにおいて、最先端の性能を達成した。コードはGitHubにて公開されている:https://github.com/zqtan1024/sequence-to-set。