HyperAIHyperAI
vor 3 Monaten

Wie extrapoliert Knowledge Graph Embedding auf unbekannte Daten: Eine semantische Evidenzperspektive

Ren Li, Yanan Cao, Qiannan Zhu, Guanqun Bi, Fang Fang, Yi Liu, Qian Li
Wie extrapoliert Knowledge Graph Embedding auf unbekannte Daten: Eine semantische Evidenzperspektive
Abstract

Wissensgraph-Embedding (Knowledge Graph Embedding, KGE) zielt darauf ab, Darstellungen für Entitäten und Relationen zu lernen. Die meisten KGE-Modelle haben erheblichen Erfolg erzielt, insbesondere in Extrapolationsszenarien. Genauer gesagt kann ein trainiertes Modell bei einer bisher nicht gesehenen Tripel-Struktur (h, r, t) den fehlenden Teil – sei es t bei (h, r, ?) oder h bei (?, r, t) – korrekt vorhersagen. Diese Fähigkeit zur Extrapolation ist beeindruckend. Allerdings konzentrieren sich die meisten bestehenden KGE-Studien hauptsächlich auf die Entwicklung fein abgestimmter Tripelmodellierungsfunktionen, die hauptsächlich erklären, wie die Plausibilität beobachteter Tripel gemessen wird, jedoch nur begrenzt Aufschluss darüber geben, warum diese Methoden auf nicht gesehene Daten extrapolieren können und welche Faktoren entscheidend für eine erfolgreiche Extrapolation sind. Daher untersuchen wir in diesem Werk zwei zentrale Fragen im Zusammenhang mit der KGE-Extrapolation: 1. Wie extrapoliert KGE auf bisher unbekannte Daten? 2. Wie kann ein KGE-Modell mit besserer Extrapolationsfähigkeit entworfen werden?Zur Beantwortung der ersten Frage analysieren wir zunächst die Einflussfaktoren auf die Extrapolation auf drei Ebenen: Relation, Entität und Tripel. Daraus leiten wir drei semantische Hinweise (Semantic Evidences, SEs) ab, die aus dem Trainingsset abgeleitet werden können und wertvolle semantische Informationen für die Extrapolation liefern. Anschließend bestätigen wir die Wirksamkeit dieser SEs durch umfangreiche Experimente an mehreren typischen KGE-Methoden.Zur Beantwortung der zweiten Frage entwickeln wir ein neuartiges, auf Graph Neural Networks (GNN) basierendes KGE-Modell namens Semantic Evidence aware Graph Neural Network (SE-GNN). In SE-GNN werden die drei Ebenen der SE explizit durch entsprechende Nachbarschaftsmuster modelliert und durch eine mehrschichtige Aggregation effektiv zusammengeführt. Dadurch wird eine stärkere, extrapolierte Wissensrepräsentation ermöglicht. Abschließend zeigen wir anhand umfangreicher Experimente auf den Datensätzen FB15k-237 und WN18RR, dass SE-GNN die derzeit beste Leistung im Task Knowledge Graph Completion erzielt und eine überlegene Extrapolationsfähigkeit aufweist. Unser Quellcode ist unter https://github.com/renli1024/SE-GNN verfügbar.