Verbessertes dynamisches Gedächtnisnetzwerk für die Klassifizierung von Dialogakten mit adversarialem Training

Die Klassifizierung von Dialogakten (DA) ist ein anspruchsvolles Problem bei der Interpretation von Dialogen, das darauf abzielt, semantische Etiketten zu Äußerungen anzuhängen und die Absicht des Sprechers zu charakterisieren. Derzeit formulieren viele bestehende Ansätze das Problem der DA-Klassifizierung, das von Multi-Klassifikation bis hin zu strukturierten Vorhersagen reicht, unter zwei Einschränkungen: a) Diese Methoden basieren entweder auf manuell erstellten Merkmalen oder haben begrenzte Gedächtniskapazitäten. b) Feindliche Beispiele können durch traditionelle Trainingsmethoden nicht korrekt klassifiziert werden. Um diese Probleme zu lösen, stellen wir in diesem Artikel das Problem als Frage- und Antwortproblem dar und schlagen ein verbessertes dynamisches Gedächtnisnetzwerk mit hierarchischem pyramidalen Äußerungsencoder vor. Darüber hinaus wenden wir feindliches Training (adversarial training) an, um unser vorgeschlagenes Modell zu trainieren. Wir evaluieren unser Modell anhand zweier öffentlicher Datensätze, nämlich dem Switchboard Dialogue Act Corpus und dem MapTask-Corpus. Ausführliche Experimente zeigen, dass unser vorgeschlagenes Modell nicht nur robust ist, sondern auch eine bessere Leistung erzielt im Vergleich zu einigen der neuesten Baseline-Methoden (state-of-the-art baselines).