
要約
ドキュメントレベルの関係抽出(RE)は、全文にわたるエンティティ間の関係を同定することを目的としている。このタスクには、共参照(coreference)や常識的知識など、多様な知識を統合するための高度な推論能力が必要となる。大規模な知識グラフ(KG)には現実世界の豊富な事実が含まれており、ドキュメントレベルREに有益な知識を提供できる。本論文では、現在のドキュメントレベルREモデルの性能を向上させるため、エンティティ知識の注入フレームワークを提案する。具体的には、共参照知識を注入するための共参照蒸留(coreference distillation)を導入し、REモデルにより汎用的な共参照推論能力を付与する。また、表現の整合(representation reconciliation)を用いて事実知識を注入し、KGの表現とドキュメントの表現を統一された空間に統合する。2つのベンチマークデータセットにおける実験により、本提案フレームワークの汎化性能が検証されるとともに、複数のドキュメントレベルREモデルに対して一貫した性能向上が確認された。