Entitätskonsistentes end-to-end-Aufgabenorientiertes Dialogsystem mit KB-Retrieval-Modul

Die Abfrage der Wissensbasis (KB) stellt seit langem eine Herausforderung in end-to-end aufgabenorientierten Dialogsystemen dar. Bisherige Ansätze zur Dialoggenerierung auf Basis von Sequenz-zu-Sequenz (Seq2Seq)-Modellen behandeln die KB-Abfrage als eine Aufmerksamkeitsmechanik über die gesamte KB, wobei jedoch keine Garantie besteht, dass die generierten Entitäten untereinander konsistent sind. In diesem Paper stellen wir einen neuartigen Ansatz vor, der die KB-Abfrage in zwei Schritten durchführt, um die Konsistenz der generierten Entitäten zu verbessern. Im ersten Schritt, inspiriert durch die Beobachtung, dass eine Antwort in der Regel durch eine einzelne Zeile der KB gestützt werden kann, führen wir eine KB-Abfragekomponente ein, die explizit die relevanteste KB-Zeile basierend auf dem Dialogverlauf zurückgibt. Das Ergebnis dieser Abfrage wird anschließend verwendet, um irrelevante Entitäten in einem Seq2Seq-Modell zur Antwortgenerierung zu filtern, wodurch die Konsistenz der Ausgabentitäten erhöht wird. Im zweiten Schritt wenden wir eine Aufmerksamkeitsmechanik auf die am stärksten korrelierten KB-Spalten an. Um die Trainierbarkeit des Modells ohne gelabelte Abfrage-Daten zu gewährleisten, werden zwei Methoden vorgeschlagen: Distant Supervision und die Gumbel-Softmax-Technik. Experimente an zwei öffentlich verfügbaren aufgabenorientierten Dialog-Datensätzen zeigen die Wirksamkeit unseres Ansatzes, da er die Baseline-Systeme übertrifft und konsistente Entitäten in den Antworten generiert.