HyperAIHyperAI
il y a 2 mois

Apprentissage Sequence-to-Sequence pour le Dialogue Orienté vers une Tâche avec Représentation de l'État du Dialogue

Haoyang Wen; Yijia Liu; Wanxiang Che; Libo Qin; Ting Liu
Apprentissage Sequence-to-Sequence pour le Dialogue Orienté vers une Tâche avec Représentation de l'État du Dialogue
Résumé

Les modèles de pipeline classiques pour les systèmes de dialogue orientés tâche nécessitent une modélisation explicite des états de dialogue et des espaces d'action conçus manuellement pour interroger une base de connaissances spécifique à un domaine. En revanche, les modèles séquence-à-séquence apprennent à mapper l'historique du dialogue à la réponse du tour actuel sans interroger explicitement une base de connaissances. Dans cette étude, nous proposons un cadre novateur qui tire parti des avantages des modèles de pipeline classiques et des modèles séquence-à-séquence. Notre cadre modélise l'état du dialogue comme une représentation distribuée de taille fixe et utilise cette représentation pour interroger une base de connaissances via un mécanisme d'attention. Les expériences menées sur le jeu de données Stanford Multi-turn Multi-domain Task-oriented Dialogue montrent que notre cadre surpasse significativement les autres modèles basés sur la séquence-à-séquence, tant en évaluation automatique qu'en évaluation humaine.

Apprentissage Sequence-to-Sequence pour le Dialogue Orienté vers une Tâche avec Représentation de l'État du Dialogue | Articles de recherche récents | HyperAI