
要約
本稿では、知識グラフ(KG)におけるエンティティアライメントに関する新たな問題設定を検討する。知識グラフは異なるエンティティ集合を有するため、相互にアライメントが取れないエンティティ(「ぶら下がりエンティティ」)が存在しうる。この問題に対して、本研究は初めてのアプローチとして、新たなデータセットを構築し、エンティティアライメントとぶら下がりエンティティ検出の両方を同時に行うマルチタスク学習フレームワークを設計した。このフレームワークは、検出されたぶら下がりエンティティに対してアライメント予測を回避する選択が可能である。ぶら下がりエンティティの検出には、最近傍距離の分布に基づく3つの手法を提案する。すなわち、最近傍分類、マージナルランク付け、バックグラウンドランク付けである。ぶら下がりエンティティを検出し削除した後、フレームワーク内に統合されたエンティティアライメントモデルは、残存するエンティティに対してより堅牢なアライメントを提供する。包括的な実験と分析により、本フレームワークの有効性が実証された。さらに、ぶら下がりエンティティ検出モジュールが、アライメント学習および最終的な性能向上にも寄与することが明らかになった。本研究で提供するリソースは公開されており、今後の研究を促進することを目的としている。