R$^3$: Verstärkter Leser-Rangierer für Offene Domänen Fragebeantwortung

In den letzten Jahren haben Forscher bei der Anwendung von neuronalen Netzwerkmethoden auf Frage-Antwort-Systeme (QA) erhebliche Erfolge erzielt. Diese Ansätze haben in vereinfachten, geschlossenen Domänen wie dem SQuAD-Datensatz (Rajpurkar et al., 2016) erstklassige Ergebnisse geliefert, bei dem ein vorab ausgewählter Text bereitgestellt wird, aus dem die Antwort auf eine gegebene Frage extrahiert werden kann. Kürzlich haben Forscher begonnen, offene Domänen in QA zu bearbeiten, bei denen das Modell eine Frage und Zugang zu einem großen Korpus (z.B. Wikipedia) erhält, anstatt einen vorab ausgewählten Text (Chen et al., 2017a). Dieses Szenario ist komplexer, da es eine groß angelegte Suche nach relevanten Textabschnitten durch ein Information Retrieval-Komponente erfordert, kombiniert mit einem Leseverständnismodell, das die Abschnitte „liest“, um eine Antwort auf die Frage zu generieren. Die Leistung in diesem Szenario fällt deutlich hinter die Leistung in geschlossenen Domänen zurück. In dieser Arbeit präsentieren wir ein neues offenes QA-System namens Reinforced Ranker-Reader ((R^3)), das auf zwei algorithmischen Innovationen basiert. Erstens schlagen wir eine neue Pipeline für offene QA-Vorgänge vor, die eine Rangfolgenkomponente (Ranker) enthält, die gelernt hat, abgerufene Textabschnitte nach ihrer Wahrscheinlichkeit zu rangieren, die korrekte Antwort auf eine gegebene Frage zu liefern. Zweitens schlagen wir eine neuartige Methode vor, mit der der Rangfolgenkomponente und ein Antwortgenerierungslesemodell (Reader) gemeinsam trainiert werden können, wobei das Training auf Verstärkungslernen basiert. Wir berichten umfangreiche experimentelle Ergebnisse, die zeigen, dass unsere Methode erhebliche Verbesserungen gegenüber dem aktuellen Stand der Technik für mehrere offene QA-Datensätze bringt.