Neuraler Glaubensverfolger: datengetriebene Dialogzustandserkennung

Einer der Kernbestandteile moderner sprachbasierter Dialogsysteme ist der Glaubensverfolger (belief tracker), der das Ziel des Benutzers bei jedem Schritt des Dialogs schätzt. Die meisten aktuellen Ansätze haben jedoch Schwierigkeiten, auf größere und komplexere Dialogbereiche zu skalieren. Dies liegt an ihrer Abhängigkeit von entweder: a) Modellen zur Verarbeitung gesprochener Sprache (Spoken Language Understanding), die große Mengen annotierter Trainingsdaten erfordern; oder b) manuell erstellten Lexika zur Erfassung einiger linguistischer Variationen in der Sprache der Benutzer. Wir schlagen einen neuen Rahmen für neuronale Glaubensverfolgung (Neural Belief Tracking, NBT) vor, der diese Probleme durch den Einsatz jüngster Fortschritte im Bereich des Repräsentationslernens überwindet. NBT-Modelle nutzen vortrainierte Wortvektoren, lernen diese in verteilte Darstellungen von Benutzeräußerungen und Dialogkontext zu kombinieren. Unsere Auswertung anhand zweier Datensätze zeigt, dass dieser Ansatz frühere Einschränkungen übertrifft und die Leistungsfähigkeit der besten bisherigen Modelle erreicht, die auf manuell erstellten semantischen Lexika basieren, und sie sogar übertreffen kann, wenn solche Lexika nicht zur Verfügung stehen.