Dialogzustandsverfolgung mit einem Sprachmodell unter Verwendung schema-getriebener Prompting

aufgabenorientierte dialogbasierte Systeme verwenden häufig die Dialogzustandserkennung (Dialogue State Tracking, DST), um die Absichten des Nutzers zu repräsentieren, was die Ausfüllung von vordefinierten Slots mit Werten umfasst. Es wurden zahlreiche Ansätze vorgeschlagen, die oft spezifische Architekturen mit spezialisierten Klassifikatoren nutzen. In jüngster Zeit wurden jedoch hervorragende Ergebnisse mit allgemeineren Architekturen erzielt, die auf vortrainierten Sprachmodellen basieren. In diesem Beitrag stellen wir eine neue Variante des Sprachmodellierungsansatzes vor, die schemagetriebene Prompting-Techniken nutzt, um eine auf die Aufgabe abgestimmte Historiecodierung zu ermöglichen, die sowohl für kategoriale als auch für nicht-kategoriale Slots verwendet wird. Die Leistung wird weiter verbessert, indem das Prompting durch Schema-Beschreibungen ergänzt wird – eine natürlich vorkommende Quelle an in-domain-Wissen. Unser rein generativer Ansatz erreicht Spitzenleistungen auf MultiWOZ 2.2 und zeigt wettbewerbsfähige Ergebnisse auf zwei weiteren Benchmarks: MultiWOZ 2.1 und M2M. Die Daten und den Code stellen wir unter https://github.com/chiahsuan156/DST-as-Prompting zur Verfügung.