Un modèle de dialogue orienté tâche probabiliste de bout en bout avec des états de croyance latents pour l'apprentissage semi-supervisé

Les états de croyance structurés sont essentiels pour le suivi des objectifs des utilisateurs et les requêtes de base de données dans les systèmes de dialogue orientés vers des tâches. Cependant, l'entraînement des traceurs de croyance nécessite souvent des annotations coûteuses au niveau des tours pour chaque énoncé utilisateur. Dans cet article, nous visons à réduire la dépendance aux étiquettes d'état de croyance dans la construction de systèmes de dialogue bout-à-bout en exploitant les données de dialogue non étiquetées pour un apprentissage semi-supervisé. Nous proposons un modèle de dialogue probabiliste appelé LAtent BElief State (LABES), où les états de croyance sont représentés par des variables latentes discrètes et modélisés conjointement avec les réponses du système en fonction des entrées utilisateur. Cette modélisation par variables latentes nous permet de développer un apprentissage semi-supervisé dans le cadre rigoureux de l'apprentissage variationnel. De plus, nous introduisons LABES-S2S, qui est une instanciation du modèle Seq2Seq augmenté par copie du modèle LABES. Dans les expériences supervisées, LABES-S2S obtient des résultats solides sur trois jeux de données基准数据集 (benchmark datasets) de différentes tailles. En utilisant des données de dialogue non étiquetées, le LABES-S2S semi-supervisé dépasse significativement les baselines uniquement supervisées et semi-supervisées. Remarquablement, nous pouvons réduire les exigences d'annotation à 50% sans perte de performance sur MultiWOZ.注:在翻译中,"基准数据集"被保留为"benchmark datasets"以保持专业术语的一致性和准确性。