HyperAIHyperAI
vor 2 Monaten

Mehrperspektivische Kontextabgleichung für maschinelle Verstehen

Zhiguo Wang; Haitao Mi; Wael Hamza; Radu Florian
Mehrperspektivische Kontextabgleichung für maschinelle Verstehen
Abstract

Vorherige maschinelle Verständnis-Datensätze (Machine Comprehension, MC) sind entweder zu klein, um End-to-End-Tiefenlernmodelle zu trainieren, oder sie sind nicht schwierig genug, um die Fähigkeiten der aktuellen MC-Techniken angemessen zu bewerten. Der neu veröffentlichte SQuAD-Datensatz mildert diese Einschränkungen und bietet uns die Möglichkeit, realistischere MC-Modelle zu entwickeln. Basierend auf diesem Datensatz schlagen wir ein Multi-Perspektivisches Kontext-Matching-Modell (Multi-Perspective Context Matching, MPCM) vor, das ein End-to-End-System ist und direkt den Anfangs- und Endpunkt der Antwort in einem Textabschnitt vorhersagt. Unser Modell passt zunächst jedes Wort-Einbettungsvektor im Textabschnitt an, indem es ein Relevanzgewicht multipliziert, das im Vergleich zur Frage berechnet wird. Danach kodieren wir die Frage und den gewichteten Textabschnitt mithilfe bidirektionaler LSTMs (Long Short-Term Memory). Für jeden Punkt im Textabschnitt vergleicht unser Modell den Kontext dieses Punkts aus mehreren Perspektiven mit der kodierten Frage und erzeugt einen Matching-Vektor. Mit diesen Matching-Vektoren verwenden wir eine weitere bidirektionale LSTM, um alle Informationen zusammenzufassen und den Anfangs- und Endpunkt vorherzusagen. Die experimentellen Ergebnisse am Testset von SQuAD zeigen, dass unser Modell wettbewerbsfähige Ergebnisse auf dem Leaderboard erzielt.