
要約
エンティティリンクの従来のアプローチは、与えられた文書内でメンション(言及)をまず特定し、その後、知識ベース内の対応するエンティティを推論するというものである。この手法の代表的な限界は、エンティティを事前に知らずにメンションを特定しなければならない点であり、これは自然ではないだけでなく、実装上も困難である。本研究では、この問題を克服する新しいモデル、EntQA(Entity linking as Question Answering)を提案する。EntQAは、まず高速なリトリーブモジュールを用いて候補エンティティを提示し、その後、強力なリーダーモジュールにより文書を詳細に分析して、各候補エンティティに対応するメンションを特定する。本手法は、エンティティリンクとオープンドメイン質問応答の分野における最新の進展を統合し、事前学習済みモデルを活用して密度型エンティティリトリーブおよび読解理解を実現している。従来の手法とは異なり、本研究ではメンション-候補辞書や大規模な弱教師付きデータに依存しない。EntQAはGERBILベンチマークプラットフォームにおいて優れた性能を達成している。