SYGMA: System für generalisierbare modulare Fragebeantwortung über Wissensbasen

Aufgaben des Wissensbasen-Abfrageverstehens (Knowledge Base Question Answering, KBQA), die komplexe Schlussfolgerungen erfordern, etablieren sich als bedeutende Forschungsrichtung. Allerdings leiden die meisten KBQA-Systeme an mangelnder Generalisierbarkeit, insbesondere hinsichtlich zweier Dimensionen: (a) der Vielfalt an Schlussfolgerungstypen, wobei sowohl Datensätze als auch Systeme sich primär auf Multi-Hop-Schlussfolgerungen konzentrieren, und (b) der Vielfalt an Wissensbasen, wobei KBQA-Ansätze speziell auf eine einzelne Wissensbasis abgestimmt sind. In diesem Artikel präsentieren wir SYGMA, einen modularen Ansatz, der die Generalisierbarkeit über mehrere Wissensbasen und verschiedene Schlussfolgerungstypen hinweg fördert. Konkret umfasst SYGMA drei hochgradig modulare Komponenten: 1) ein wissensbasenunabhängiges Modul zur Frageinterpretation, das über verschiedene Wissensbasen hinweg gemeinsam genutzt werden kann; 2) Regeln zur Unterstützung zusätzlicher Schlussfolgerungstypen; und 3) ein wissensbasenspezifisches Modul zur Fragezuordnung und -beantwortung, das die wissensbasenspezifischen Aspekte der Antwortextraktion adressiert. Wir belegen die Wirksamkeit unseres Systems durch Evaluierungen an Datensätzen aus zwei unterschiedlichen Wissensbasen, DBpedia und Wikidata. Zudem zeigen wir die Erweiterbarkeit auf weitere Schlussfolgerungstypen durch die Evaluation auf Multi-Hop-Abfrage-Datensätzen sowie auf einem neuen Benchmark-Datensatz für zeitliche KBQA auf Wikidata, namens TempQA-WD1, der in dieser Arbeit vorgestellt wird. Wir zeigen, dass unser generalisierbarer Ansatz auf mehreren Datensätzen aus DBpedia und Wikidata, die sowohl Multi-Hop- als auch zeitliche Schlussfolgerungen erfordern, eine überzeugende und wettbewerbsfähige Leistung erzielt.