17日前
ドキュメントレベルの関係抽出のための粗いから細かいエンティティ表現
Damai Dai, Jing Ren, Shuang Zeng, Baobao Chang, Zhifang Sui

要約
ドキュメントレベル関係抽出(Document-level Relation Extraction: RE)は、文内および文間における関係を抽出することを要求する。近年の研究では、文書全体の文脈を捉える文書意識型の相互作用を表現する文書レベルグラフを構築するグラフベース手法が、有用なエンティティ表現を獲得し、ドキュメントレベルREの課題解決に貢献することが示されている。これらの手法は、全体のグラフに注目するものや、ターゲットエンティティペア間の経路に焦点を当てるものなど、それぞれ異なるアプローチを採用している。しかし、本研究では、ドキュメントレベルREにおいて、これらの両方の視点を同時に捉えることが有益である可能性を明らかにした。そこで、より包括的なエンティティ表現を獲得するために、粗い段階から細かい段階へと段階的に情報を統合する「粗-細エンティティ表現モデル(Coarse-to-Fine Entity Representation: CFER)」を提案する。まず、CFERはグラフニューラルネットワーク(GNN)を用いて、粗いレベルで全体グラフのグローバル情報を統合する。次に、得られたグローバル情報をガイドとして用い、ターゲットエンティティペア間の経路情報のみを選択的に集約する細かいレベルでの処理を行う。分類タスクでは、この二段階で得られたエンティティ表現を統合し、より包括的な表現を構築することで関係抽出を実現する。DocREDおよびCDRという2つのドキュメントレベルREデータセットにおける実験結果から、CFERが既存モデルを上回る性能を発揮し、ラベル分布の不均一性に対しても堅牢であることが確認された。