HyperAIHyperAI

Command Palette

Search for a command to run...

Ein einfaches und effektives Modell zur Beantwortung von Multi-Span-Fragen

Elad Segal Avia Efrat Mor Shoham Amir Globerson Jonathan Berant

Zusammenfassung

Modelle zur Textverstehens-Aufgabe (Reading Comprehension, RC) beschränken ihre Ausgabemenge üblicherweise auf die Menge aller einzelnen zusammenhängenden Abschnitte (spans) im Eingabetext, um das Lernproblem zu vereinfachen und die Notwendigkeit eines Modells zu vermeiden, das Text explizit generiert. Die Einschränkung auf einzelne zusammenhängende Abschnitte kann jedoch restriktiv sein, und einige neuere Datensätze enthalten zudem Fragen mit mehreren Abschnitten (multi-span questions), also Fragen, deren Antwort aus einer Menge nicht zusammenhängender Textabschnitte besteht. Natürlich können Modelle, die nur einzelne Abschnitte zurückgeben, solche Fragen nicht beantworten. In dieser Arbeit schlagen wir eine einfache Architektur zur Beantwortung von Fragen mit mehreren Abschnitten vor, indem wir die Aufgabe als Sequenzmarkierungsaufgabe formulieren: Es wird für jedes Eingabetoken vorhergesagt, ob es zum Ausgabesatz gehören soll oder nicht. Unser Modell verbessert die Leistung bei der Extraktion von Abschnitten in den Datensätzen DROP und Quoref signifikant um jeweils 9,9 bzw. 5,5 EM-Punkte.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp