2ヶ月前

ネストされた固有表現認識のための第二番目のシーケンス学習とデコーディング

Takashi Shibuya; Eduard Hovy

要約

エンティティ名に他の名前が含まれている場合、すべての名前の組み合わせを特定することは困難かつコストがかかります。本研究では、最外層のネームドエンティティだけでなく、内部にネストされたエンティティも認識する新しい方法を提案します。我々は、ネストされたエンティティのタグシーケンスを親エンティティの範囲内の第二優れたパスとして扱うニューラルモデルの学習用目的関数を設計しました。さらに、推論のために、最外層から内側へと反復的にエンティティを抽出するデコーディング手法を提供しています。当手法は、フラットなネームドエンティティ認識タスクで広く使用されている条件付き確率場（Conditional Random Field: CRF）ベースのモデルに追加のハイパーパラメータを持たないため、既存のネストされたエンティティに対応可能な手法よりも優れた性能を発揮するか、少なくとも同等以上の性能を持つことが実験によって示されています。ACE-2004、ACE-2005、GENIAデータセットにおけるF1スコアはそれぞれ85.82%、84.34%、77.36%でした。