UniK-QA: Unified Representations of Structured and Unstructured Knowledge for Open-Domain Question Answering

Wir untersuchen die offene Domänen-Fragebeantwortung unter Verwendung strukturierter, unstrukturierter und halbstrukturierter Wissensquellen, einschließlich Text, Tabellen, Listen und Wissensbasen. Im Gegensatz zu vorherigen Ansätzen schlagen wir einen einheitlichen Ansatz vor, der alle Quellen durch Reduktion auf reinen Text homogenisiert und das Retriever-Reader-Modell einsetzt, das bisher ausschließlich auf rein textbasierten Quellen angewendet wurde. Unser Ansatz steigert die Ergebnisse bei Wissensbasen-Fragebeantwortungsaufgaben im Vergleich zu den neuesten graphbasierten Methoden um 11 Punkte. Vor allem zeigen wir, dass unser einheitliches Wissensmodell (UniK-QA) eine einfache, dennoch wirksame Methode darstellt, heterogene Wissensquellen zu kombinieren, und verbessert die Stand-of-the-Art-Ergebnisse auf zwei gängigen Fragebeantwortungsbenchmarks, NaturalQuestions und WebQuestions, jeweils um 3,5 bzw. 2,6 Punkte.Der Quellcode von UniK-QA ist verfügbar unter: https://github.com/facebookresearch/UniK-QA.