
要約
関係抽出(Relation Extraction, RE)は、テキスト内の固有表現間の意味的関係を特定することを目的としている。近年、REは文書レベルへと拡張され、全文にわたってエンティティおよびその表出(mention)を複雑に推論する必要が生じている。本論文では、文書レベルの関係抽出を実現するため、エンティティのグローバル表現とローカル表現、および文脈的関係表現を用いて文書情報を符号化する新たなモデルを提案する。エンティティのグローバル表現は文書内に存在するすべてのエンティティの意味情報をモデル化し、ローカル表現は特定のエンティティの複数の表出にわたる文脈情報を集約する。また、文脈的関係表現は他の関係に関するトピック情報を符号化する。実験結果から、本モデルは文書レベルREを対象とした2つの公開データセットにおいて優れた性能を達成することが示された。特に、距離が離れているエンティティ間の関係や、複数回出現するエンティティ間の関係抽出において顕著な効果を発揮することが確認された。