HyperAIHyperAI
vor 2 Monaten

Ein wahrscheinlichkeitstheoretisches end-to-end task-orientedes Dialogmodell mit latenten Glaubenszuständen für semi-supervises Lernen

Yichi Zhang; Zhijian Ou; Huixin Wang; Junlan Feng
Ein wahrscheinlichkeitstheoretisches end-to-end task-orientedes Dialogmodell mit latenten Glaubenszuständen für semi-supervises Lernen
Abstract

Strukturierte Glaubenszustände sind für die Verfolgung von Benutzerzielen und Datenbankabfragen in taskorientierten Dialogsystemen entscheidend. Die Ausbildung von Glaubensverfolgern erfordert jedoch oft kostspielige annotierte Dialogdrehbücher auf Turn-Ebene für jede Benutzeräußerung. In dieser Arbeit zielen wir darauf ab, die Abhängigkeit von Glaubenszustandslabels bei der Erstellung von End-to-End-Dialogsystemen zu verringern, indem wir unannotierte Dialogdaten zur semi-überwachten Lernmethode nutzen. Wir schlagen ein probabilistisches Dialogmodell vor, das als LAtent BElief State (LABES)-Modell bezeichnet wird, bei dem Glaubenszustände als diskrete latente Variablen dargestellt und zusammen mit Systemantworten unter Berücksichtigung der Benutzereingaben modelliert werden. Diese Modellierung latenter Variablen ermöglicht es uns, semi-überwachtes Lernen im Rahmen des prinzipiellen variationellen Lernansatzes zu entwickeln. Darüber hinaus stellen wir LABES-S2S vor, eine Instanz eines copy-augmentierten Seq2Seq-Modells des LABES. In überwachten Experimenten erzielt LABES-S2S starke Ergebnisse auf drei Benchmark-Datensätzen unterschiedlicher Größenordnungen. Bei der Nutzung unannotierter Dialogdaten übertreffen semi-überwachte LABES-S2S sowohl die rein überwachten als auch die semi-überwachten Baseline-Modelle erheblich. Bemerkenswerterweise können wir die Anforderungen an Annotationen um 50 % reduzieren, ohne Leistungseinbußen auf MultiWOZ zu erleiden.

Ein wahrscheinlichkeitstheoretisches end-to-end task-orientedes Dialogmodell mit latenten Glaubenszuständen für semi-supervises Lernen | Neueste Forschungsarbeiten | HyperAI