HyperAIHyperAI
vor 2 Monaten

Ein Slot wird nicht in einer einzigen Äußerung erstellt: Gesprochene Dialoge mit Unter-Slots

Sai Zhang; Yuwei Hu; Yuchuan Wu; Jiaman Wu; Yongbin Li; Jian Sun; Caixia Yuan; Xiaojie Wang
Ein Slot wird nicht in einer einzigen Äußerung erstellt: Gesprochene Dialoge mit Unter-Slots
Abstract

Ein Slot-Wert kann in einem Dialog segmentweise über mehrere Interaktionsschritte bereitgestellt werden, insbesondere für wichtige Informationen wie Telefonnummern und Namen. Dies ist ein häufiges Phänomen im Alltag, das jedoch in früheren Arbeiten wenig Beachtung gefunden hat. Um diese Lücke zu schließen, definiert dieser Artikel eine neue Aufgabe namens Sub-Slot basierter task-orientierter Dialog (SSTOD) und erstellt einen chinesischen Dialog-Datensatz SSD, um die Forschung zu SSTOD zu fördern. Der Datensatz umfasst insgesamt 40.000 Dialoge und 500.000 Äußerungen aus vier verschiedenen Bereichen: chinesische Namen, Telefonnummern, Personenkennnummern (ID numbers) und Kennzeichennummern (license plate numbers). Die Daten sind gut annotiert mit Sub-Slot-Werten, Slot-Werten, Dialogzuständen und Aktionen. Wir entdecken einige neue sprachliche Phänomene und interaktive Verhaltensweisen in SSTOD, die erhebliche Herausforderungen bei der Erstellung von Dialogagenten für diese Aufgabe aufwerfen. Wir testen drei state-of-the-art-Dialogmodelle auf SSTOD und stellen fest, dass sie die Aufgabe in keiner der vier Bereiche zufriedenstellend bewältigen können. Zudem untersuchen wir ein verbessertes Modell durch die Einbindung von Slot-Wissen in Form eines Plug-ins. Weitere Arbeit ist erforderlich, um den neuen Herausforderungen gerecht zu werden, die sich aus SSTOD ergeben, das weit verbreitet in realen Anwendungen existiert. Der Datensatz und der Code sind öffentlich verfügbar unter https://github.com/shunjiu/SSTOD.