HyperAIHyperAI
vor 2 Monaten

Dynamische Ko-Attention-Netzwerke für die Frage-Antwort-Bearbeitung

Caiming Xiong; Victor Zhong; Richard Socher
Dynamische Ko-Attention-Netzwerke für die Frage-Antwort-Bearbeitung
Abstract

Mehrere Deep-Learning-Modelle wurden für die Frage-Antwort-Bearbeitung vorgeschlagen. Aufgrund ihrer einstufigen Natur haben diese Modelle jedoch keine Möglichkeit, sich von lokalen Maxima zu erholen, die falschen Antworten entsprechen. Um dieses Problem zu lösen, stellen wir das Dynamic Coattention Network (DCN) für die Frage-Antwort-Bearbeitung vor. Das DCN fusioniert zunächst ko-abhängige Darstellungen der Frage und des Dokuments, um relevante Teile beider zu fokussieren. Anschließend durchläuft ein dynamischer Pointing-Decodier potentielle Antwortbereiche iterativ. Dieses iterative Verfahren ermöglicht es dem Modell, sich von anfänglichen lokalen Maxima zu erholen, die falschen Antworten entsprechen. Bei der Stanford-Frage-Antwort-Datensatz-Evaluation verbessert ein einzelnes DCN-Modell den bisherigen Stand der Technik von 71,0 % F1 auf 75,9 %, während eine DCN-Ensemble-Konfiguration einen F1-Wert von 80,4 % erreicht.