Command Palette
Search for a command to run...
Dynamisches Fusionsnetzwerk für mehrdomänenbasierte end-to-end-Aufgabenorientierte Dialogsysteme
Dynamisches Fusionsnetzwerk für mehrdomänenbasierte end-to-end-Aufgabenorientierte Dialogsysteme
Libo Qin Xiao Xu Wanxiang Che Yue Zhang Ting Liu
Zusammenfassung
Kürzliche Studien haben beachtlichen Erfolg bei end-to-end-Aufgabenorientierten Dialogsystemen gezeigt. Allerdings beruhen die meisten neuronalen Modelle auf großen Trainingsdaten, die lediglich für eine begrenzte Anzahl von Aufgabendomänen, wie Navigation und Terminplanung, verfügbar sind. Dies erschwert die Skalierbarkeit auf neue Domänen mit begrenzten gelabelten Daten. Bisher existiert jedoch vergleichsweise wenig Forschung darüber, wie Daten aus allen Domänen effektiv genutzt werden können, um die Leistung sowohl in bekannten als auch in bisher nicht gesehenen Domänen zu verbessern. Um diesem Problem zu begegnen, untersuchen wir Methoden, die explizit Domänenwissen nutzen, und führen ein gemeinsames-privates Netzwerk ein, um gemeinsame und domänenspezifische Kenntnisse zu lernen. Zudem stellen wir ein neuartiges dynamisches Fusionsnetzwerk (DF-Net) vor, das automatisch die Relevanz zwischen der Ziel-Domäne und jeder anderen Domäne ausnutzt. Die Ergebnisse zeigen, dass unser Modell bestehende Ansätze bei mehrdomänenbasierten Dialogen übertrifft und die derzeit beste Leistung in der Literatur erzielt. Darüber hinaus demonstrieren wir bei nur geringem Trainingsdatenbedarf eine hervorragende Übertragbarkeit, indem wir das vorherige Bestmodell im Durchschnitt um 13,9 % schlagen.