2ヶ月前

知識グラフにおける半誘導的リンク予測のベンチマーク

Adrian Kochsiek; Rainer Gemulla
知識グラフにおける半誘導的リンク予測のベンチマーク
要約

知識グラフ(KG)における半誘導的リンク予測(LP)は、文脈情報に基づいて新しい、以前に見たことのないエンティティに関する事実を予測するタスクである。原理的には、新しいエンティティをモデルから再学習することで統合できるが、大規模なKGでは再学習が高コストであり、新しいエンティティが頻繁に発生するため、このようなアプローチは現実的ではない。本論文では、半誘導的LPモデルの評価用に大規模なベンチマークを提案し、その詳細を説明する。このベンチマークはWikidata5Mを基盤とし、拡張している。具体的には、(i) KGの構造のみを使用するトランスダクティブLPタスク、(ii) テキスト参照を含むkショットLPタスク、(iii) エンティティの詳細な説明を使用する0ショットLPタスクを提供しており、それぞれ利用可能な情報が異なる。私たちは最近の手法について的小規模研究を行い、すべての実験において長尾エンティティに対する半誘導的LP性能がトランスダクティブ性能よりも大幅に劣っていることを確認した。このベンチマークは、半誘導的LPモデルにおける文脈とテキスト情報の統合に関するさらなる研究の試験台となる。注:「長尾エンティティ」(long-tail entities)という表現は一般的でないため、原文表記も併記しました。

知識グラフにおける半誘導的リンク予測のベンチマーク | 最新論文 | HyperAI超神経