HyperAIHyperAI
vor 17 Tagen

Ein einfaches und effektives Modell zur Beantwortung von Multi-Span-Fragen

Elad Segal, Avia Efrat, Mor Shoham, Amir Globerson, Jonathan Berant
Ein einfaches und effektives Modell zur Beantwortung von Multi-Span-Fragen
Abstract

Modelle zur Textverstehens-Aufgabe (Reading Comprehension, RC) beschränken ihre Ausgabemenge üblicherweise auf die Menge aller einzelnen zusammenhängenden Abschnitte (spans) im Eingabetext, um das Lernproblem zu vereinfachen und die Notwendigkeit eines Modells zu vermeiden, das Text explizit generiert. Die Einschränkung auf einzelne zusammenhängende Abschnitte kann jedoch restriktiv sein, und einige neuere Datensätze enthalten zudem Fragen mit mehreren Abschnitten (multi-span questions), also Fragen, deren Antwort aus einer Menge nicht zusammenhängender Textabschnitte besteht. Natürlich können Modelle, die nur einzelne Abschnitte zurückgeben, solche Fragen nicht beantworten. In dieser Arbeit schlagen wir eine einfache Architektur zur Beantwortung von Fragen mit mehreren Abschnitten vor, indem wir die Aufgabe als Sequenzmarkierungsaufgabe formulieren: Es wird für jedes Eingabetoken vorhergesagt, ob es zum Ausgabesatz gehören soll oder nicht. Unser Modell verbessert die Leistung bei der Extraktion von Abschnitten in den Datensätzen DROP und Quoref signifikant um jeweils 9,9 bzw. 5,5 EM-Punkte.

Ein einfaches und effektives Modell zur Beantwortung von Multi-Span-Fragen | Neueste Forschungsarbeiten | HyperAI