KERMIT: Wissensgraphen-Vervollständigung durch verbessertes Relationenmodellierung mit inverser Transformation

Die Kompletierung von Wissensgraphen (Knowledge Graph Completion, KGC) befasst sich mit der Ergänzung fehlender Tripel in einem Wissensgraphen mithilfe verfügbarer Informationen. Textbasierte Ansätze, die auf textlichen Beschreibungen von Tripeln beruhen, stoßen oft auf Schwierigkeiten, wenn diese Beschreibungen nicht ausreichend Informationen für eine präzise Vorhersage enthalten – ein Problem, das inhärent in den Datensätzen liegt und nicht allein durch Modellierung zu lösen ist. Um diesem Problem entgegenzuwirken und die Datenkonsistenz sicherzustellen, nutzen wir zunächst große Sprachmodelle (Large Language Models, LLMs), um kohärente Beschreibungen zu generieren, wodurch die semantische Lücke zwischen Anfragen und Antworten geschlossen wird. Zweitens verwenden wir inverse Relationen, um einen symmetrischen Graphen zu erstellen, was ergänzende Trainingsbeispiele für die KGC bereitstellt. Darüber hinaus nutzen wir die in Wissensgraphen (KGs) inhärente Label-Information, um den bestehenden kontrastiven Rahmen zu verbessern und ihn vollständig überwacht zu machen. Diese Maßnahmen haben zu erheblichen Leistungssteigerungen auf den Datensätzen WN18RR und FB15k-237 geführt. Gemäß gängigen Evaluationsmetriken erreicht unser Ansatz eine Verbesserung um 4,2 % bei Hit@1 auf WN18RR und eine Verbesserung um 3,4 % bei Hit@3 auf FB15k-237, was eine überlegene Leistung belegt.