Mehrgranularität Darstellungen von Dialogen

Neuronale Dialogmodelle basieren auf verallgemeinerten latente Darstellungen der Sprache. In dieser Arbeit wird ein neues Trainingsverfahren vorgestellt, das explizit mehrere Darstellungen der Sprache auf verschiedenen Granularitätsebenen lernt. Der Multi-Granularitäts-Trainingsalgorithmus modifiziert den Mechanismus, durch den negative Kandidatenantworten ausgewählt werden, um die Granularität der gelernten latenten Darstellungen zu steuern. Bei der Aufgabe der nächsten Äußerungserkennung werden starke Leistungsverbesserungen sowohl mit dem MultiWOZ-Datensatz als auch mit dem Ubuntu-Dialogkorpus beobachtet. Die Analyse zeigt signifikant, dass mehrere Granularitätsstufen von Darstellungen gelernt werden und dass das Multi-Granularitäts-Training eine bessere Übertragbarkeit auf nachgelagerte Aufgaben ermöglicht.