
要約
関係抽出(Relation Extraction, RE)は、与えられた2つのエンティティ間の関係を予測する重要な自然言語処理タスクであり、優れたモデル性能を達成するためには文脈情報の正確な理解が不可欠である。さまざまな種類の文脈情報の中でも、自動生成された句構造情報(すなわち、語の依存関係)がこのタスクにおいて有効性を示している。しかし、既存の多くの研究では、依存構造情報を活用するためには、既存のベースラインアーキテクチャに新たな構成要素(例えば、エンコーダーの上にグラフ畳み込みネットワーク(GCN)などを追加するなど)を導入する必要がある。こうした手法への代替案として、本研究では、依存関係マスキングを用いて自動解析されたデータ上で構造誘導型エンコーダーを学習することで、依存構造情報を活用する手法を提案する。具体的には、1次、2次、3次の依存関係接続およびその種類をマスクされた状態から復元するように構造誘導型エンコーダーを訓練する。これは、従来の研究が依存パスに沿った文脈語を予測することで言語モデルや単語埋め込みを学習するのに対し、根本的に異なるアプローチである。ACE2005ENおよびSemEval 2010 Task 8の2つの英語ベンチマークデータセットにおける実験結果から、本手法がREタスクにおいて有効であることが示された。本手法は強力なベースラインを上回り、両データセットで最先端(state-of-the-art)の性能を達成した。