
要約
依存関係木は、単語間の長距離の関係を捉えるために関係抽出モデルに役立ちます。しかし、既存の依存関係に基づくモデルは、依存関係木を過度に剪定することにより重要な情報を(例えば、否定)無視するか、異なる木構造間での並列化が困難であるため計算効率が低いという問題があります。本研究では、関係抽出に特化したグラフ畳み込みネットワークの拡張版を提案します。この方法は、任意の依存構造から効率的に情報を集約し、並列処理を行うことができます。さらに、2つのエンティティ間の最短経路周辺にある単語のみを残す新しい剪定戦略を入力木に適用することで、関連情報を取り込む一方で最大限不要な情報を削除します。結果として得られたモデルは大規模なTACREDデータセットにおいて最先端の性能を達成し、既存のシーケンスベースおよび依存関係に基づくニューラルモデルを上回りました。詳細な分析を通じて、このモデルがシーケンスモデルと相補的な強みを持ち、それらを組み合わせることでさらなる最先端性能の向上が示されました。