11日前
部分観測済みTreeCRFを用いたネストされた名前付きエンティティ認識
Yao Fu, Chuanqi Tan, Mosha Chen, Songfang Huang, Fei Huang

要約
命名エンティティ認識(Named Entity Recognition, NER)は、自然言語処理分野で広く研究されているタスクである。しかし、一般的に用いられるシーケンスラベリング枠組みでは、ネスト構造を持つエンティティの検出は困難である。本研究では、ネスト型NERを部分観測木を伴う構文解析問題として捉え、部分観測TreeCRF(Partially-Observed TreeCRF)を用いてモデル化する。具体的には、ラベル付けされたすべてのエンティティスパンを構文木における観測ノードとみなし、その他のスパンを潜在ノードと定義する。TreeCRFを用いることで、観測ノードと潜在ノードを一貫した方法で同時にモデル化できる。部分木の確率を部分的マージナライゼーションにより計算するため、観測ノードに対して評価、潜在ノードに対してマージナライゼーション、観測内容と整合しないノードに対しては排除を行うことができる、新たなインサイドアルゴリズム「Masked Inside」を提案する。このアルゴリズムは並列化実装が可能であり、学習および推論の高速化を実現している。実験の結果、本手法はACE2004およびACE2005データセットにおいて、現在の最先端(SOTA)のF1スコアを達成し、GENIAデータセットにおいてもSOTAモデルと同等の性能を示した。本研究の実装は以下のURLで公開されている:\url{https://github.com/FranxYao/Partially-Observed-TreeCRFs}。