2ヶ月前
RESIDE: 副情報を利用した遠隔監督ニューラル関係抽出の改善
Shikhar Vashishth; Rishabh Joshi; Sai Suman Prayaga; Chiranjib Bhattacharyya; Partha Talukdar

要約
遠隔監督関係抽出(Relation Extraction: RE)手法は、知識ベース(Knowledge Base: KB)内の関係インスタンスを非構造化テキストと自動的に対応付けることで、抽出器を訓練します。関係インスタンスに加えて、KBには通常、関係の別名(例:「設立」と「共設立」は「FounderOfCompany」の別名である)などの他の関連する補助情報が含まれています。しかし、REモデルは一般的にこのような容易に利用可能な補助情報を無視しています。本論文では、RESIDEという遠隔監督ニューラル関係抽出手法を提案します。この手法は、KBから得られる追加の補助情報を利用することで、関係抽出の精度を向上させます。RESIDEはエンティティタイプと関係別名情報を用いて、関係予測時にソフト制約を課します。また、グラフ畳み込みネットワーク(Graph Convolution Networks: GCN)を使用してテキストからの構文情報を符号化し、限られた補助情報しか利用できない場合でも性能を向上させます。ベンチマークデータセットを用いた広範な実験を通じて、RESIDEの有効性を示しています。再現可能な研究を促進するために、RESIDEのソースコードを公開しています。