HyperAIHyperAI
vor 2 Monaten

RAG-basierte Fragebeantwortung über heterogene Daten und Texte

Philipp Christmann; Gerhard Weikum
RAG-basierte Fragebeantwortung über heterogene Daten und Texte
Abstract

Dieser Artikel stellt das QUASAR-System zur Fragebeantwortung über unstrukturierten Text, strukturierte Tabellen und Wissensgraphen vor, wobei alle Quellen einheitlich behandelt werden. Das System verwendet eine RAG-basierte Architektur (Retrieval-Augmented Generation), bei der ein Pipeline-Prozess von Beweisrecherche gefolgt wird von einer Antwortgenerierung, die durch ein moderat großes Sprachmodell angetrieben wird. Zudem verfügt QUASAR über einzigartige Komponenten für die Frageverarbeitung, um präzisere Eingaben für die Beweisrecherche abzuleiten, sowie für das Neurankieren und Filtern der zurückgewonnenen Beweise, bevor die informativsten Teile in die Antwortgenerierung eingespeist werden. Experimente mit drei verschiedenen Benchmarks zeigen die hohe Qualität unserer Herangehensweise bei der Fragebeantwortung, welche mit großen GPT-Modellen auf gleicher Höhe liegt oder diese sogar übertreffen kann, während gleichzeitig die Rechenkosten und Energieverbrauch um Größenordnungen geringer sind.