2ヶ月前
Sequence-to-Nuggets: アンカーリージョンネットワークを用いたネストされたエンティティメンション検出
Hongyu Lin; Yaojie Lu; Xianpei Han; Le Sun

要約
連続ラベリングに基づく固有表現認識(NER)手法は、各単語が最大でも1つのエンティティメンションに属することを制限しており、ネストされたエンティティメンションの認識では深刻な問題に直面します。本論文では、この問題を解決するために、エンティティメンションのヘッド駆動的な句構造をモデル化し、活用する方法を提案します。つまり、あるメンションが他のメンションをネストしていても、同じヘッドワードを共有することはないと仮定します。具体的には、Anchor-Region Networks (ARNs) と呼ばれるネストしたメンション検出のためのシーケンス・トゥ・ナグ겟構造を提案します。ARNs はまずすべてのメンションのアンカーワード(すなわち、可能なヘッドワード)を識別し、その後、規則的な句構造を利用して各アンカーワードのメンション境界を認識します。さらに、Bag Loss という目的関数も設計しました。これは、任意のアンカーワード注釈を使用せずに ARNs をエンドツーエンドで学習させることが可能です。実験結果は、ARNs が3つの標準的なネストしたエンティティメンション検出ベンチマークにおいて最先端の性能を達成していることを示しています。