Analyse von Wissensgraphen-Einbettungsmethoden aus der Perspektive der Multi-Einbettungsinteraktion

Wissensgraphen sind ein beliebtes Format zur Darstellung von Wissen und finden Anwendung in semantischen Suchmaschinen, Frage-Antwort-Systemen und Empfehlungssystemen. Reale Wissensgraphen sind jedoch oft unvollständig, weshalb Methoden zur Einbettung von Wissensgraphen wie die kanonische Zerlegung/parallele Faktorisierung (CP), DistMult und ComplEx vorgeschlagen wurden, um dieses Problem zu lösen. Diese Methoden stellen Entitäten und Relationen als Einbettungsvektoren im semantischen Raum dar und prognostizieren die Verbindungen zwischen ihnen. Die Einbettungsvektoren selbst enthalten reichhaltige semantische Informationen und können in anderen Anwendungen wie der Datenanalyse verwendet werden. Allerdings unterscheiden sich die Mechanismen dieser Modelle sowie die Einbettungsvektoren selbst stark, was es schwierig macht, sie zu verstehen und miteinander zu vergleichen. Aufgrund dieses Mangel an Verständnis besteht das Risiko, dass wir sie ineffektiv oder falsch einsetzen, insbesondere bei komplexeren Modellen wie CP mit zwei rollenbasierten Einbettungsvektoren oder dem neuesten Stand der Technik ComplEx-Modell mit komplexwertigen Einbettungsvektoren. In dieser Arbeit schlagen wir einen Mehrfacheinbettungsinteraktionsmechanismus vor, der eine neue Methode darstellt, um diese Modelle zu vereinen und zu verallgemeinern. Wir leiten sie theoretisch durch diesen Mechanismus ab und liefern empirische Analysen sowie Vergleiche zwischen ihnen. Des Weiteren präsentieren wir ein neues Mehrfacheinbettungsmodell basierend auf Quaternionenalgebra und zeigen, dass es vielversprechende Ergebnisse bei gängigen Benchmarks erzielt. Der Quellcode ist auf GitHub unter https://github.com/tranhungnghiep/AnalyzeKGE verfügbar.