
要約
ドキュメントレベルの関係抽出(DocRE)は、複数の文から構成されるドキュメント内の2つのエンティティ間の関係を決定することを目指しています。最近の研究では、通常、シーケンスベースまたはグラフベースのモデルを使用して、ドキュメント全体を表現し、すべてのエンティティペアの関係を予測しています。しかし、我々はこのようなモデルが堅牢性に欠け、奇妙な挙動を示すことを発見しました:テストドキュメント全体が入力として与えられた場合に正しく予測しますが、証拠となる文以外が削除されると誤ります。この問題に対処するため、我々はDocRE用の文重要度推定と焦点化(SIEF)フレームワークを提案します。ここで、文重要度スコアと文焦点化損失を設計し、DocREモデルが証拠となる文に焦点を当てるよう促しています。2つの領域での実験結果は、我々のSIEFが全体的な性能向上だけでなく、DocREモデルの堅牢性も向上させることを示しています。さらに、SIEFは汎用的なフレームワークであり、さまざまな基本的なDocREモデルと組み合わせて有効であることが確認されています。