Eine universelle Frage-Antwort-Plattform für Wissensgraphen

Wissen aus verschiedenen Anwendungsdomänen wird in Wissensgraphen (Knowledge Graphs, KGs) organisiert, die in RDF-Engines gespeichert sind und über SPARQL-Endpunkte im Web zugänglich sind. Die Formulierung einer korrekten SPARQL-Abfrage erfordert Informationen über die Struktur des Graphen sowie die exakten URIs seiner Komponenten – eine Anforderung, die für den durchschnittlichen Nutzer unpraktisch ist. Frage-Antwort-Systeme (QA-Systeme) unterstützen dabei, natürliche Sprachfragen in SPARQL-Abfragen zu übersetzen. Bisherige QA-Systeme basieren typischerweise auf anwendungsspezifischen, von Menschen erstellten Regeln oder erfordern Vorwissen, aufwändige Vorverarbeitung und Modellanpassungen für jeden Ziel-KG. Daher sind sie schwer auf eine breite Palette von Anwendungen und Wissensgraphen verallgemeinerbar.In diesem Artikel stellen wir KGQAn vor, ein universelles QA-System, das nicht an jeden Ziel-KG angepasst werden muss. Anstelle von handverfassten Regeln formalisiert KGQAn das Verständnis von Fragen als ein Problem der Textgenerierung und wandelt eine Frage mittels eines neuronalen Sequenz-zu-Sequenz-Modells in eine abstrakte, intermediäre Darstellung um. Außerdem entwickeln wir einen just-in-time-Linker, der zur Abfragezeit die abstrakte Darstellung mithilfe ausschließlich der öffentlich zugänglichen APIs und der bestehenden Indizes des RDF-Speichers einer konkreten KG in eine SPARQL-Abfrage überführt, ohne dass vorab eine Verarbeitung erforderlich ist. Unsere Experimente mit mehreren realen Wissensgraphen zeigen, dass KGQAn leicht einzusetzen ist und hinsichtlich der Antwortqualität und Verarbeitungszeit gegenüber dem Stand der Technik deutlich übertrifft – insbesondere bei beliebigen, während des Trainings nicht gesehenen KGs.