Fusion de dialogues orientés tâches et de dialogues à domaine ouvert dans les agents conversationnels

L’objectif de la construction de systèmes de dialogue intelligents a principalement été poursuivi de manière indépendante selon deux paradigmes : les systèmes de dialogue orientés vers une tâche (TOD), qui réalisent des fonctions à objectif précis, et les systèmes de dialogue ouvert (ODD), qui se concentrent sur des échanges informels sans objectif spécifique. Ces deux modes de dialogue pourraient théoriquement s’interconnecter de manière fluide au sein d’une même conversation, comme le ferait un assistant humain bienveillant. Une telle capacité est particulièrement souhaitable dans les agents conversationnels, car elle rend ces derniers plus accessibles et utiles. Notre article aborde précisément le problème de la fusion entre les systèmes TOD et ODD dans des dialogues à plusieurs tours. À partir du jeu de données TOD largement utilisé MultiWOZ, nous avons construit un nouveau jeu de données, FusedChat, en réécrivant les échanges TOD existants et en ajoutant de nouveaux échanges ODD. Cette procédure permet de créer des sessions de conversation intégrant des échanges provenant des deux modes. Ce jeu de données présente une dépendance contextuelle inter-mode, c’est-à-dire que les échanges des deux modes s’influencent mutuellement. Il inclut des motifs de dépendance riches, tels que la co-référence et l’ellipse. Le nouveau jeu de données, comprenant 60 000 nouveaux échanges ODD rédigés par des humains et 5 000 échanges TOD réécrits, constitue une référence pour évaluer la capacité d’un modèle de dialogue à mener des conversations inter-mode. Il s’agit d’une tâche plus exigeante, car le modèle doit non seulement déterminer le mode de dialogue approprié, mais aussi générer une réponse fondée sur le contexte inter-mode. Des modèles capables de telles performances se rapprochent davantage des capacités conversationnelles humaines. Nous évaluons des modèles de base sur cette tâche, notamment des modèles à deux étapes basés sur la classification et des modèles fusionnés « deux-en-un ». Nous mettons publiquement à disposition FusedChat ainsi que les modèles de base afin de stimuler les travaux futurs sur les systèmes de dialogue inter-mode : https://github.com/tomyoung903/FusedChat.