
要約
エンティティリンクは、テキストの区間をオントロジーや知識源にリンクすることにより構造化データを作成する研究の主要な一分野です。本稿では、各入力トークンをエンティティとして分類し、トークンの予測結果を集約する構造化予測をエンティティリンクに再適用します。当システムは SpEL(Structured prediction for Entity Linking)と呼ばれ、最新のエンティティリンクシステムであり、以下の新しいアイデアを用いて構造化予測をエンティティリンクに適用しています:2つの洗練されたファインチューニングステップ;文脈に敏感な予測集約戦略;モデルの出力語彙のサイズ削減;そして、訓練時と推論時のトークン化の不一致というエンティティリンクシステムにおける一般的な問題に対処しています。実験結果から、SpEL は AIDA ベンチマークデータセットにおいて Wikipedia へのエンティティリンクで既存の最先端手法を上回ることが示されました。また、当手法はパラメータ数と推論速度において非常に計算効率が良いことも確認されています。