
要約
関係抽出(Relation Extraction)とは、生テキスト内に存在するエンティティの表記範囲(mention span)を特定し、それらエンティティ表記のペア間の関係を同定するタスクである。近年のこのスパンレベルのタスクに対するアプローチは、トークンレベルのモデルが主流であるが、これらには固有の制限がある。具体的には、スパンレベルの特徴を容易に定義・実装できないこと、重複するエンティティ表記を適切にモデル化できないこと、および逐次デコーディングの使用に起因する誤差の累積(cascading errors)が生じることである。これらの課題に対処するため、本研究ではすべての可能なスパンを直接モデル化し、エンティティ表記の検出と関係抽出を統合的に実行するモデルを提案する。このモデルにより、ACE2005データセットにおいて62.83のF1スコア(従来の最高値60.49)を達成し、新たな最先端性能を報告した。