18日前

文書レベルの関係抽出をための文脈化された参照表現の導入と参照ペアの重み付け

{Ping Jiang;Xian-Ling Mao;Binbin Bian;Heyan Huang}
要約

ドキュメントレベルの関係抽出(Document-level Relation Extraction, RE)は、多数の関係的事実が複数の文に分散して表現されるため、近年注目を集めている。特に、エンコーダー・アグリゲーター型モデルがドキュメントレベルREにおいて有望なアプローチとして浮上している。しかし、これらのモデルには以下の2つの課題がある。(i)同じ表記(mention)が異なるエンティティペアに含まれる場合、低コストで文脈に応じた表記表現を取得できないこと。(ii)ターゲットとなるエンティティペアにおける表記ペア間の重みの違いを無視してしまうこと。上記の問題を解決するため、本論文ではエンコーダーとアグリゲーターの間に2つのアテンションモジュール(attender)を導入した新しい「エンコーダー・アテンダー・アグリゲーター(EncAttAgg)」モデルを提案する。具体的には、まず選択された頭部および末部の表記に対して相互アテンション(mutual attender)を適用し、効率的に文脈に応じた表記表現を生成する。次に、ターゲットエンティティペアの表記ペアに対して重み付けを行うための統合アテンション(integration attender)を導入する。2つのドキュメントレベルREデータセットにおける広範な実験の結果、提案モデルは最先端のベースラインモデルを上回る性能を示した。本研究の実装コードは公開されており、以下のURLから入手可能である:https://github.com/nefujiangping/EncAttAgg。