17日前
CHOLAN:WikipediaおよびWikidataにおけるニューラルエンティティリンクのためのモジュール式アプローチ
Manoj Prabhakar Kannan Ravi, Kuldeep Singh, Isaiah Onando Mulang', , Saeedeh Shekarpour, Johannes Hoffart, Jens Lehmann

要約
本稿では、知識ベース上でエンドツーエンドのエンティティリンク(EL)を対象とするモジュール型アプローチ、CHOLANを提案する。CHOLANは、ELタスクを達成するために逐次的に統合された2つのTransformerベースのモデルから構成されるパイプラインである。最初のTransformerモデルは、与えられたテキスト内における表面表現(エンティティの出現表現)を同定する。各出現表現に対して、2番目のTransformerモデルが事前に定義された候補エンティティリストの中から適切なターゲットエンティティを分類する。2番目のTransformerモデルは、文単位の局所的文脈(local context)およびWikipediaから取得したエンティティの説明文という拡張された外部文脈を入力として用いる。このような外部文脈の利用は、従来の最先端ELアプローチでは行われていなかった。実証的研究は、広く知られる2つの知識ベース(すなわちWikidataおよびWikipedia)を対象として実施された。実験結果から、CHOLANはCoNLL-AIDA、MSNBC、AQUAINT、ACE2004、T-RExといった標準データセットにおいて、既存の最先端手法を上回る性能を示した。