2ヶ月前
複数エンティティの認識と関係抽出をマルチヘッド選択問題として扱う
Giannis Bekoulis; Johannes Deleu; Thomas Demeester; Chris Develder

要約
最新の共同エンティティ認識と関係抽出モデルは、外部の自然言語処理(NLP)ツール、例えば品詞タグ付け(POS: part-of-speech)や依存構造解析に強く依存しています。したがって、これらの共同モデルの性能は、これらのNLPツールから得られる特徴量の質に大きく影響されます。しかし、これらの特徴量は様々な言語や文脈に対して常に正確とは限りません。本論文では、手動で抽出された特徴量や外部ツールを使用せずに、エンティティ認識と関係抽出を同時に実行する共同ニューラルモデルを提案します。具体的には、エンティティ認識タスクを条件付き確率場(CRF: Conditional Random Fields)層を使用してモデリングし、関係抽出タスクをマルチヘッド選択問題として扱います(つまり、各エンティティに対して複数の関係を潜在的に識別する)。我々は多様な文脈(ニュース、バイオメディカル、不動産など)および言語(英語、オランダ語など)のデータセットを使用して、本手法の有効性を示すための包括的な実験設定を提示します。我々のモデルは自動的に抽出された特徴量を使用する以前のニューラルモデルよりも優れた性能を示し、特徴量に基づくニューラルモデルと比較しても合理的な範囲内での性能を達成しています、あるいはそれらを超えることもあります。