Beantwortung von beliebigen Hop-Offenen-Domänen-Fragen mit iterativer Dokument-Reranking

Bestehende Ansätze für offene Domänen-Fragebeantwortung (QA) sind typischerweise für Fragen konzipiert, die entweder eine einstellige oder mehrstufige Schlussfolgerung erfordern, wodurch starke Annahmen über die Komplexität der zu beantwortenden Fragen getroffen werden. Zudem führt der mehrstufige Dokumentenretrieval oft zu einer hohen Anzahl relevanter, aber nicht unterstützender Dokumente, was die nachgeschaltete, geräuschempfindliche Lesemodule für die Antwortextraktion beeinträchtigt. Um diese Herausforderungen zu bewältigen, schlagen wir einen einheitlichen QA-Framework vor, der beliebige mehrstufige offene Domänen-Fragen beantworten kann. Unser Ansatz iterativiert den Retrieval-Prozess durch wiederholtes Abrufen, Neubewertung und Filtern von Dokumenten und bestimmt adaptiv, wann der Retrieval-Prozess beendet werden soll. Um die Retrieval-Genauigkeit zu verbessern, präsentieren wir ein graphbasiertes Neubewertungsmodell, das die Interaktion mehrerer Dokumente als Kernkomponente unseres iterativen Neubewertungsframeworks nutzt. Unser Verfahren erreicht konsistent Leistungen, die mit oder besser als die des derzeitigen Standes der Technik auf sowohl einstufigen als auch mehrstufigen offenen Domänen-QA-Datensätzen sind, darunter Natural Questions Open, SQuAD Open und HotpotQA.