Einsetzen der Absatzretrieval-Technik mit generativen Modellen für die offene Domänen-Fragebeantwortung

Generative Modelle für Fragebeantwortung im offenen Domänenbereich haben sich als wettbewerbsfähig erwiesen, ohne auf externe Wissensquellen zurückgreifen zu müssen. Obwohl vielversprechend, erfordern diese Ansätze Modelle mit mehreren Milliarden Parametern, die kostspielig in der Trainings- und Abfragephase sind. In diesem Paper untersuchen wir, inwieweit diese Modelle von der Abfrage von Textpassagen profitieren können, die möglicherweise relevante Beweise enthalten. Wir erzielen state-of-the-art-Ergebnisse auf den offenen Benchmarks Natural Questions und TriviaQA. Interessanterweise stellen wir fest, dass die Leistung dieser Methode signifikant steigt, wenn die Anzahl der abgerufenen Passagen erhöht wird. Dies liefert Hinweise darauf, dass generative Modelle besonders gut darin sind, Beweise aus mehreren Passagen zu aggregieren und zu kombinieren.