
要約
ドキュメントレベル関係抽出(DocRE)は、文レベルの対応するタスクと比較してより困難な課題である。このタスクは、複数の文を一度に処理して関係を抽出することを目的としている。本論文では、三つの新規な要素を備えた準教師あり枠組みを提案する。まず、エンティティペア間の相互依存関係を学習するための軸方向アテンションモジュールを用いることで、二ステップ関係(two-hop relations)の性能が向上した。次に、DocREにおけるクラス不均衡問題に対処するため、適応型フォーカル損失(adaptive focal loss)を提案する。最後に、人間によるアノテーションデータと遠隔教師あり(distantly supervised)データとの差異を克服するために、知識蒸留(knowledge distillation)を活用する。我々は2つのDocREデータセット上で実験を行い、強力なベースラインを一貫して上回る性能を達成した。特にDocREDのリーダーボードにおいて、従来のSOTA(最良手法)をF1スコアで1.36点、Ign_F1スコアで1.46点上回った。本研究のコードおよびデータは、https://github.com/tonytan48/KD-DocRE にて公開される予定である。