Outlining and Filling: Hierarchische Generierung von Abfragegraphen zur Beantwortung komplexer Fragen über Wissensgraphen

Die Konstruktion von Abfragegraphen (Query Graph Construction) strebt danach, die korrekte ausführbare SPARQL-Abfrage auf dem Wissensgraphen (KG) zu erstellen, um natürlichsprachliche Fragen zu beantworten. Obwohl aktuelle Methoden mit neuronenetzbasiertem Rangieren von Abfragegraphen gute Ergebnisse erzielt haben, stoßen sie bei der Bearbeitung komplexerer Fragen auf drei neue Herausforderungen: 1) komplizierte SPARQL-Syntax, 2) riesiger Suchraum und 3) lokal ambige Abfragegraphen. In dieser Arbeit präsentieren wir eine neue Lösung. Als Vorbereitung erweitern wir den Abfragegraphen, indem wir jeden SPARQL-Klausel als Untergraph betrachten, der aus Knoten und Kanten besteht, und definieren eine einheitliche Graphgrammatik namens AQG (Abstract Query Graph), um die Struktur der Abfragegraphen zu beschreiben. Aufbauend auf diesen Konzepten schlagen wir ein neues end-to-end-Modell vor, das hierarchisches autoregressives Decoding durchführt, um Abfragegraphen zu generieren. Das hochrangige Decoding generiert einen AQG als Constraint, um den Suchraum einzuschränken und lokal ambige Abfragegraphen zu reduzieren. Das niederstufige Decoding vollzieht die Konstruktion des Abfragegraphen, indem es geeignete Instanzen aus vorbereiteten Kandidaten auswählt, um die Plätze im AQG zu füllen. Die experimentellen Ergebnisse zeigen, dass unsere Methode die state-of-the-art-Leistung bei komplexen Benchmarks für Wissensgraph-basierte Fragebeantwortung (KGQA) erheblich verbessert. Durch die Verwendung vortrainierter Modelle wird die Leistung unserer Methode weiter gesteigert und erreicht den State-of-the-Art für alle drei verwendeten Datensätze.