Mem2Seq: Effektive Integration von Wissensbasen in End-to-End task-orientierte Dialogsysteme

End-to-End taskorientierte Dialogsysteme leiden in der Regel unter der Herausforderung, Wissensbasen zu integrieren. In dieser Arbeit schlagen wir ein neuartiges und dennoch einfaches end-to-end differenzierbares Modell vor, das als Memory-to-Sequence (Mem2Seq) bezeichnet wird, um dieses Problem anzugehen. Mem2Seq ist das erste neurale generative Modell, das die mehrstufige Aufmerksamkeit über Erinnerungen mit dem Konzept des Pointer Networks verbindet. Wir zeigen empirisch, wie Mem2Seq jeden Generierungsschritt steuert und wie sein mehrstufiges Aufmerksamkeitsmechanismus beim Lernen von Korrelationen zwischen Erinnerungen hilft. Darüber hinaus ist unser Modell sehr allgemein und erfordert keine komplizierten taskspezifischen Designs. Als Ergebnis zeigen wir, dass Mem2Seq schneller trainiert werden kann und den Stand der Technik auf drei verschiedenen taskorientierten Dialogdatensätzen erreicht.请注意,这里将“end-to-end”翻译为“end-to-end”,因为这是科技领域中的一个通用术语,通常在德语中也保留其英文形式。同样,“state-of-the-art”也被翻译为“Stand der Technik”,这是德语中常用的对应表达。其他术语如“multi-hop attention”和“pointer network”则直接采用了德语中的专业术语翻译。