Verbesserung der Multi-hop-Fragebeantwortung über Wissensgraphen unter Verwendung von Wissensbasis-Embeddings

Wissensgraphen (Knowledge Graphs, KG) sind mehrrelationale Graphen, die aus Entitäten als Knoten und Beziehungen zwischen diesen als typisierten Kanten bestehen. Das Ziel der Aufgabe „Fragebeantwortung über Wissensgraphen“ (KGQA) besteht darin, natürlichsprachliche Abfragen über den KG zu beantworten. Bei der mehrschrittigen KGQA ist ein Schlussfolgern über mehrere Kanten des KG erforderlich, um zur richtigen Antwort zu gelangen. Wissensgraphen sind oft unvollständig und weisen viele fehlende Verbindungen auf, was zusätzliche Herausforderungen für die KGQA, insbesondere für die mehrschrittige KGQA, darstellt. In jüngeren Forschungsarbeiten wurde versucht, die Sparsität von KGs durch die Nutzung relevanter externer Textinformationen zu bewältigen – diese sind jedoch nicht immer leicht verfügbar. In einer separaten Forschungsrichtung wurden Methoden zur KG-Embedding vorgeschlagen, um die Sparsität von KGs durch die Vorhersage fehlender Verbindungen zu reduzieren. Obwohl solche KG-Embedding-Methoden hochgradig relevant sind, wurden sie bisher noch nicht für die mehrschrittige KGQA genutzt. In dieser Arbeit schließen wir diese Lücke und stellen EmbedKGQA vor. EmbedKGQA erweist sich insbesondere bei der mehrschrittigen KGQA über spärliche KGs als äußerst effektiv. Zudem löst EmbedKGQA die Einschränkung früherer Methoden zur mehrschrittigen KGQA auf, die eine Antwortauswahl aus einer vordefinierten Nachbarschaft erforderten, was eine suboptimale Einschränkung darstellt. Anhand umfangreicher Experimente auf mehreren Standard-Datensätzen zeigen wir die Überlegenheit von EmbedKGQA gegenüber anderen state-of-the-art-Baselines.