17日前
SAIS:ドキュメントレベル関係抽出における中間ステップの監視と拡張
Yuxin Xiao, Zecheng Zhang, Yuning Mao, Carl Yang, Jiawei Han

要約
文書レベルへの拡張に伴い、関係抽出(Relation Extraction: RE)の研究は、テキスト長の増大とエンティティ間のより複雑な相互作用という課題に直面している。その結果、関連する文脈やエンティティタイプといった重要な情報源を効果的に符号化することがますます困難になっている。しかし、従来の手法はREの学習過程においてこれらの重要な情報源を間接的にしか学習できず、その結果、効果的な教師信号の欠如や予測結果の解釈不能という問題に直面している。これに対して、本研究では、REのための中間段階を明示的に監視・拡張する(Supervising and Augmenting Intermediate Steps: SAIS)アプローチを提案する。これにより、モデルに関連する文脈やエンティティタイプを明示的に捉える能力を教える。広範な精心設計されたタスクに基づく本手法は、より効果的な教師信号により、高品質な関係抽出を実現するだけでなく、対応する支援証拠の検索精度も向上させ、モデルの解釈性を高める。さらに、モデルの不確実性を評価することで、証拠に基づくデータ拡張とアンサンブル推論を実施し、計算コストの削減と性能向上を同時に達成する。最終的に、SAISはDocRED、CDR、GDAの3つのベンチマークにおいて最先端のRE性能を達成し、特にDocREDにおける証拠検索タスクで、準優勝手法に対してF1スコアで5.04%の相対的な向上を実現した。