Neuronale QA so einfach wie möglich, aber nicht einfacher machen

Die jüngste Entwicklung großer Frage-Antwort-(QA)-Datenmengen hat erhebliche Forschungsarbeiten zu end-to-end neuronalen Architekturen für QA angeregt. Immer komplexere Systeme wurden konzipiert, ohne sie mit einfachen neuronalen Baseline-Systemen zu vergleichen, die ihre Komplexität rechtfertigen würden. In dieser Arbeit schlagen wir eine einfache Heuristik vor, die die Entwicklung von neuronalen Baseline-Systemen für die extraktive QA-Aufgabe leitet. Wir stellen fest, dass zwei Elemente notwendig sind, um ein hochleistungsfähiges neuronales QA-System zu bauen: Erstens, das Bewusstsein für Fragewörter während der Verarbeitung des Kontexts und zweitens, eine Kompositions-Funktion, die über einfache Bag-of-Words-Modelle hinausgeht, wie z.B. rekurrente Neuronale Netze. Unsere Ergebnisse zeigen, dass FastQA, ein System, das diese beiden Anforderungen erfüllt, eine sehr wettbewerbsfähige Leistung im Vergleich zu bestehenden Modellen erzielen kann. Wir argumentieren, dass dieses überraschende Ergebnis die Resultate früherer Systeme und die Komplexität neuerer QA-Datenmengen in ein neues Licht rückt.