2ヶ月前

並列処理による高精度の自己回帰エンティティリンクと識別的補正

Nicola De Cao; Wilker Aziz; Ivan Titov
並列処理による高精度の自己回帰エンティティリンクと識別的補正
要約

生成モデルは最近、エンティティ解釈とエンティティリンク(すなわち、共通参照の検出と解釈)の両分野で効果的であることが示されています。しかし、従来提案されたEL(エンティティリンク)の自己回帰型フォーマリゼーションには、i) 複雑な(深層)デコーダによる高い計算コスト、ii) ソースシーケンス長に比例してスケーリングする非並列化可能なデコード処理、iii) 大量のデータでの学習の必要性という問題がありました。本研究では、すべての潜在的な参照に対して自己回帰型リンクを並列化し、浅く効率的なデコーダを用いた非常に効率的なアプローチを提案します。さらに、生成目的関数に追加の識別成分(つまり、ジェネレータのランキングを直接最適化する補正項)を導入します。これらの技術を組み合わせることで、上記のすべての問題が解決されます:当社のモデルは以前の生成手法よりも70倍以上高速かつ正確であり、標準的な英語データセットAIDA-CoNLLにおいて最先端の手法を上回っています。ソースコードは https://github.com/nicola-decao/efficient-autoregressive-EL で利用可能です。

並列処理による高精度の自己回帰エンティティリンクと識別的補正 | 最新論文 | HyperAI超神経