HyperAIHyperAI

Command Palette

Search for a command to run...

Dynamische Ko-Attention-Netzwerke für die Frage-Antwort-Bearbeitung

Caiming Xiong Victor Zhong Richard Socher

Zusammenfassung

Mehrere Deep-Learning-Modelle wurden für die Frage-Antwort-Bearbeitung vorgeschlagen. Aufgrund ihrer einstufigen Natur haben diese Modelle jedoch keine Möglichkeit, sich von lokalen Maxima zu erholen, die falschen Antworten entsprechen. Um dieses Problem zu lösen, stellen wir das Dynamic Coattention Network (DCN) für die Frage-Antwort-Bearbeitung vor. Das DCN fusioniert zunächst ko-abhängige Darstellungen der Frage und des Dokuments, um relevante Teile beider zu fokussieren. Anschließend durchläuft ein dynamischer Pointing-Decodier potentielle Antwortbereiche iterativ. Dieses iterative Verfahren ermöglicht es dem Modell, sich von anfänglichen lokalen Maxima zu erholen, die falschen Antworten entsprechen. Bei der Stanford-Frage-Antwort-Datensatz-Evaluation verbessert ein einzelnes DCN-Modell den bisherigen Stand der Technik von 71,0 % F1 auf 75,9 %, während eine DCN-Ensemble-Konfiguration einen F1-Wert von 80,4 % erreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Dynamische Ko-Attention-Netzwerke für die Frage-Antwort-Bearbeitung | Paper | HyperAI