HyperAIHyperAI
vor 17 Tagen

UNIQORN: Unified Question Answering über RDF-Wissensgraphen und natürliche Sprachtexte

Soumajit Pramanik, Jesujoba Alabi, Rishiraj Saha Roy, Gerhard Weikum
UNIQORN: Unified Question Answering über RDF-Wissensgraphen und natürliche Sprachtexte
Abstract

Die Fragebeantwortung über RDF-Daten wie Wissensgraphen hat erheblich Fortschritte gemacht, wobei eine Reihe guter Systeme präzise Antworten auf natürliche Sprachfragen oder telegrafische Abfragen liefern können. Einige dieser Systeme integrieren zusätzliche Textquellen als Beweismaterial für den Antwortprozess, können jedoch Antworten nicht berechnen, die ausschließlich im Text enthalten sind. Umgekehrt haben die Informationsretrieval- (IR) und Natural Language Processing (NLP)-Gemeinschaften Fragebeantwortung über Text bearbeitet, doch solche Systeme nutzen semantische Daten und Wissensbestände kaum. In diesem Paper wird eine Methode für komplexe Fragen vorgestellt, die nahtlos über eine Kombination aus RDF-Datenbeständen und Textkorpora, oder auch über einzelne Quellen, in einem einheitlichen Rahmen arbeitet. Unser Ansatz, UNIQORN genannt, erstellt dynamisch einen Kontextgraphen, indem er frage-relevante Beweise aus RDF-Daten und/oder einem Textkorpus mithilfe feinabgestimmter BERT-Modelle abruft. Der resultierende Graph enthält typischerweise alle frage-relevanten Beweise, jedoch auch erhebliche Rauschanteile. UNIQORN bewältigt diese Eingabedaten durch einen Graphenalgorithmen zur Berechnung von Gruppen-Steiner-Bäumen, der die besten Antwortkandidaten im Kontextgraphen identifiziert. Experimentelle Ergebnisse auf mehreren Benchmarks komplexer Fragen mit mehreren Entitäten und Relationen zeigen, dass UNIQORN state-of-the-art-Methoden für heterogene Fragebeantwortung erheblich übertrifft – sowohl im vollständigen Trainingsmodus als auch in Zero-Shot-Szenarien. Die graphenbasierte Methodik liefert für den gesamten Antwortprozess nachvollziehbare, vom Benutzer interpretierbare Beweise.