
要約
本研究は、視覚的な意味表現を使用して異種の知識グラフ(Knowledge Graphs: KGs)内のエンティティを対応させる手法について考察します。画像は多くの既存のKGにおいて自然な構成要素となっています。視覚的な知識と他の補助情報を組み合わせることで、提案する新しいアプローチEVAが全体的なエンティティ表現を作成し、グラフ間のエンティティ対応に強い信号を提供することを示しています。また、従来のエンティティ対応手法では、人間によるラベル付けされたシード対応が必要であり、これが利用可能性を制限していました。EVAは、エンティティの視覚的類似性を利用して初期のシード辞書(visual pivots)を作成することで、完全に教師なしの解決策を提供します。ベンチマークデータセットDBP15kおよびDWY15kにおける実験結果から、EVAが単一言語および複数言語間のエンティティ対応タスクにおいて最先端の性能を発揮することが確認されました。さらに、画像が長尾部 KG エンティティ(long-tail KG entities)の対応に特に有用であることが判明しました。これらのエンティティは本来的に構造的情報が不足しており、対応関係を捉える上で必要不可欠な役割を果たします。