2ヶ月前

ReLiK: Retrieve and LinK, 学術的な予算で高速かつ正確なエンティティリンクと関係抽出

Orlando, Riccardo ; Cabot, Pere-Lluis Huguet ; Barba, Edoardo ; Navigli, Roberto
ReLiK: Retrieve and LinK, 学術的な予算で高速かつ正確なエンティティリンクと関係抽出
要約

エンティティリンク(EL)と関係抽出(RE)は、自然言語処理における基本的なタスクであり、多様な応用分野において重要な役割を果たしています。本論文では、ReLiKというリトリーバー-リーダー構造を提案します。この構造はELとREの両方に適用可能で、入力テキストが与えられた場合、リトリーバーモジュールがテキスト内に潜在的に現れる可能性のある候補のエンティティや関係を識別します。その後、リーダーモジュールがこれらの関連する候補のエンティティや関係を判別し、対応するテキスト範囲との整合性を確立する役割を担います。特に注目すべきは、候補のエンティティや関係をテキストとともに取り入れる革新的な入力表現です。これにより、単一の順方向パスでエンティティをリンクしたり関係を抽出したりすることが可能となり、事前学習済み言語モデルの文脈化能力を完全に活用できます。これは、以前のリトリーバー-リーダーベースの手法とは異なります。それらの手法では各候補に対して順方向パスが必要でした。我々のELとREの定式化は、学術予算内で訓練を行いながら、ドメイン内およびドメイン外ベンチマークで最先端の性能を達成しており、競合他社と比較して最大40倍の推論速度を実現しています。最後に、共有リーダーを使用してエンティティと関係を同時に抽出することで新しい最先端レベルを設定し、情報抽出(cIE)、つまりEL + REに当社アーキテクチャがシームレスに利用できる方法について示します。