
要約
名前付きエンティティ抽出(Named Entity Recognition, NER)は自然言語処理における基本的なタスクであり、テキスト内のエンティティを表すトークン列(スパン)を特定することを目的としている。従来のNER研究は、主に平坦なエンティティ(flat NER)に焦点を当てており、実際にはエンティティ参照がネスト可能であるという事実、例えば「[中国銀行]」のような構造(Finkel and Manning, 2009)を無視している。本論文では、グラフベースの依存構文解析のアイデアを活用し、双アフィンモデル(biaffine model)を用いて入力に対するグローバルな視点をモデルに与える。この双アフィンモデルは、文内の開始トークンと終了トークンのペアに対してスコアを付与し、すべてのスパンを探索可能にすることで、モデルが正確に名前付きエンティティを予測できるようにする。8つのコーパスを用いた評価を通じて、本モデルがネスト構造を含むNERおよび平坦なNERの両方において優れた性能を発揮することを示し、すべてのデータセットで最先端(SoTA)の性能を達成した。特に、精度向上は最大で2.2パーセンテージポイントに達した。