Beweisaggregation für die Neuanordnung von Antworten in der offenen Domänen-Fragebeantwortung

Ein populärer Ansatz zur Beantwortung von offenen Fragen besteht darin, zunächst nach fragenbezogenen Passagen zu suchen und dann Leseverständnismodelle anzuwenden, um Antworten zu extrahieren. Bestehende Methoden extrahieren in der Regel Antworten unabhängig voneinander aus einzelnen Passagen. Einige Fragen erfordern jedoch eine Kombination von Beweisen aus verschiedenen Quellen, um korrekt beantwortet werden zu können. In dieser Arbeit schlagen wir zwei Modelle vor, die mehrere Passagen nutzen, um ihre Antworten zu generieren. Beide Modelle verwenden einen Antwort-Neuordnungsansatz (answer-reranking), der die durch ein bestehendes state-of-the-art-Frage-Antwort-Modell (QA model) generierten Antwortkandidaten neu ordnet. Wir schlagen zwei Methoden vor: stärkebasierte Neuordnung (strength-based re-ranking) und abdeckungsbasierte Neuordnung (coverage-based re-ranking), um die aggregierten Beweise aus verschiedenen Passagen besser zu bewerten und so das richtige Antwortkandidat zu bestimmen. Unsere Modelle haben auf drei öffentlichen offenen QA-Datensätzen – Quasar-T, SearchQA und der offene Version von TriviaQA – state-of-the-art-Ergebnisse erzielt, wobei sie bei den ersten beiden Datensätzen eine Verbesserung von etwa 8 Prozentpunkten gegenüber bisherigen Methoden aufweisen.