HyperAIHyperAI
vor 2 Monaten

Textverstehen mit dem Attention Sum Reader Netzwerk

Rudolf Kadlec; Martin Schmid; Ondrej Bajgar; Jan Kleindienst
Textverstehen mit dem Attention Sum Reader Netzwerk
Abstract

Mehrere große Cloze-artige Kontext-Frage-Antwort-Datensätze wurden kürzlich vorgestellt: die CNN- und Daily-Mail-Nachrichtendaten sowie der Children's Book Test. Dank der Größe dieser Datensätze ist die zugehörige Textverstehenaufgabe besonders geeignet für Tiefenlernmethoden, die derzeit alle alternativen Ansätze zu übertreffen scheinen. Wir präsentieren ein neues, einfaches Modell, das Aufmerksamkeit verwendet, um die Antwort direkt aus dem Kontext auszuwählen, anstatt die Antwort mithilfe einer gemischten Repräsentation der Wörter im Dokument zu berechnen, wie es in ähnlichen Modellen üblich ist. Dies macht das Modell besonders geeignet für Frage-Antwort-Probleme, bei denen die Antwort ein einzelnes Wort aus dem Dokument ist. Eine Ensemble unserer Modelle setzt einen neuen Stand der Technik auf allen evaluierten Datensätzen.