
要約
エンドツーエンド関係抽出は、名前付きエンティティを同定し、それらの間の関係を抽出することを目的としている。近年の大多数の研究では、これらの2つのサブタスクを統合的に扱うアプローチが採用されており、いずれかの構造化予測フレームワークに統合するか、共有表現を通じたマルチタスク学習を行う。本研究では、エンティティと関係抽出のためのシンプルなパイプライン手法を提案し、標準的なベンチマーク(ACE04、ACE05、SciERC)において新たな最先端性能を達成した。同一の事前学習済みエンコーダを使用した前例の統合モデルと比較して、関係抽出のF1スコアで1.7%~2.8%の絶対的向上を実現した。本手法の本質は、2つの独立したエンコーダを構築し、エンティティ抽出モデルの出力を関係抽出モデルの入力として用いることにあり、エンティティモデルは関係モデルの入力構築にのみ利用される。慎重な実験を通じて、エンティティと関係それぞれに異なる文脈表現を学習することが重要であることを検証し、関係モデル内でエンティティ情報を早期に統合すること、およびグローバルな文脈を組み込むことの有効性を示した。さらに、推論時にエンティティエンコーダと関係エンコーダの両方を一度だけ走査する効率的な近似手法も提案した。この手法は、精度のわずかな低下を伴いながらも、8~16倍の高速化を実現した。