17日前

明示的な表記-表記共参照モデルを用いたエンティティリンクング

{Andrew McCallum, Nicholas Monath, Rico Angell, Dhruv Agarwal}
明示的な表記-表記共参照モデルを用いたエンティティリンクング
要約

エンティティメンションの表現学習は、現代のエンティティリンクングシステムにおいて、候補生成とリンク予測の両方の側面で中心的な役割を果たしている。本論文では、複数ドキュメントにわたるメンションとエンティティ間の最小全域有向木(最小全域アボレセンス、minimum spanning arborescences)を構築することで、メンションの共参照関係を明示的にモデル化する新しい訓練手法を提示し、その有効性を実証的に分析する。我々の手法は、ゼロショットエンティティリンクングデータセットおよび、公開されている最大規模の生物医療分野データセットであるMedMentionsにおいて、候補生成の再現率およびリンク精度の著しい向上を示した。さらに、候補生成の改善が、下流の再ランク付けモデルの品質向上につながることを示し、MedMentionsにおけるリンク精度において新たなSOTA(State-of-the-Art)を達成した。最後に、改善されたメンション表現が、ドキュメント間共参照を通じた新規エンティティの発見においても有効であることを実証した。