
要約
オープン情報抽出(Open Information Extraction: OpenIE)は、オープンドメインの文から関係タプルを抽出することを目的としている。従来のルールベースや統計的手法は、文の構文構造を構文解析器によって同定した上で構築されてきた。しかし、これまでのニューラル型OpenIEモデルは、有用な構文情報の活用を十分に行っていない。本論文では、構成構文木(constituency tree)および依存構文木(dependency tree)を単語レベルのグラフとしてモデル化し、ニューラル型OpenIEが構文構造から学習できるようにする。さらに、両グラフから得られる異種の情報を効果的に統合するため、複数視点学習(multi-view learning)を採用し、それらから複数の関係性を捉えることを可能にする。最終的に、微調整された構成構文および依存構文の表現を、文の意味表現と統合してタプル生成に用いる。実験の結果、構成構文情報および依存構文情報の両方が有効であり、また複数視点学習の導入が効果的であることが示された。