Aufgabenorientierte Dialogsysteme, die mehrere angemessene Antworten im gleichen Kontext berücksichtigen

Gespräche haben eine inhärente Eigenschaft von einem-zu-vielen, was bedeutet, dass mehrere Antworten für denselben Dialogkontext angemessen sein können. In aufgabenorientierten Dialogen führt diese Eigenschaft zu verschiedenen gültigen Dialogstrategien zur Aufgabenbearbeitung. Bislang berücksichtigt jedoch keiner der existierenden Ansätze zur Generierung aufgabenorientierter Dialoge diese Eigenschaft. Wir schlagen ein Framework für Multi-Aktion-Datenverstärkung (MADA) vor, um die einen-zu-vielen-Eigenschaft zu nutzen und vielfältige, angemessene Dialogantworten zu generieren. Insbesondere verwenden wir zunächst Dialogzustände, um den Dialogverlauf zusammenzufassen, und entdecken dann alle möglichen Zuordnungen von jedem Dialogzustand zu seinen verschiedenen gültigen Systemaktionen. Während des Trainings des Dialogsystems ermöglichen wir es dem aktuellen Dialogzustand, sich mit allen im vorherigen Prozess gefundenen gültigen Systemaktionen zu verbinden, um zusätzliche Zustands-Aktions-Paare zu erstellen. Durch die Einbeziehung dieser zusätzlichen Paare lernt die Dialogpolitik eine ausgewogene Aktionverteilung, die das Dialogmodell weiterhin anleitet, vielfältige Antworten zu generieren. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene Framework die Vielfalt der Dialogpolitik konsistent verbessert und somit auch die Vielfalt und Angemessenheit der Antworten erhöht. Unser Modell erzielt state-of-the-art-Ergebnisse auf MultiWOZ.