Réseau de fusion dynamique pour la dialogue orienté vers les tâches multi-domaines en bout-en-bout

Des études récentes ont démontré un succès remarquable dans les systèmes de dialogue orientés vers une tâche, de manière end-to-end. Toutefois, la plupart des modèles neuronaux reposent sur de grandes quantités de données d'entraînement, disponibles uniquement pour un nombre restreint de domaines, tels que la navigation ou la planification. Cela rend difficile l'extension à de nouveaux domaines disposant de données étiquetées limitées. Or, peu de recherches se sont penchées sur la manière d'utiliser efficacement les données issues de tous les domaines afin d'améliorer les performances dans chaque domaine, y compris ceux non vus auparavant. À cet effet, nous explorons des méthodes permettant une utilisation explicite des connaissances spécifiques aux domaines, et introduisons un réseau partagé-privé conçu pour apprendre à la fois des connaissances communes et des connaissances propres à chaque domaine. Par ailleurs, nous proposons un nouveau réseau de fusion dynamique (DF-Net), capable d'exploiter automatiquement la pertinence entre le domaine cible et chaque domaine existant. Les résultats montrent que notre modèle surpasser les méthodes existantes dans le cadre de dialogues multi-domaines, atteignant ainsi l'état de l'art dans la littérature. En outre, même avec peu de données d'entraînement, nous démontrons sa capacité de transfert en surpassant, en moyenne, le meilleur modèle antérieur de 13,9 %.