End-to-End Offene Fragebeantwortung mit BERTserini

Wir präsentieren ein End-to-End-Fragebeantwortungssystem, das BERT mit dem Open-Source-Information-Retrieval-Toolkit Anserini integriert. Im Gegensatz zu den meisten heutigen Fragebeantwortungs- und Leseverständnismodellen, die mit kleinen Textmengen arbeiten, kombiniert unser System bewährte Methoden der Informationsabruf (IR) mit einem auf BERT basierenden Leser, um Antworten aus einem großen Korpus von Wikipedia-Artikeln in einem End-to-End-Prozess zu identifizieren. Wir berichten über erhebliche Verbesserungen im Vergleich zu früheren Ergebnissen einer standardisierten Benchmark-Sammlung, wobei gezeigt wird, dass das Feinjustieren des vortrainierten BERT mit SQuAD ausreicht, um eine hohe Genauigkeit bei der Identifikation von Antwortabschnitten zu erreichen.