HyperAIHyperAI
il y a 2 mois

Réseau d'Appariement Interactif de Séquence à Séquence pour la Sélection de Réponses Multitour dans les Chatbots Basés sur la Récupération

Jia-Chen Gu; Zhen-Hua Ling; Quan Liu
Réseau d'Appariement Interactif de Séquence à Séquence pour la Sélection de Réponses Multitour dans les Chatbots Basés sur la Récupération
Résumé

Ce papier propose un réseau d'appariement interactif de tour en tour (U2U-IMN) pour la sélection de réponses multiroues dans les chatbots basés sur la recherche. Contrairement aux méthodes précédentes qui suivaient des cadres d'appariement contexte-réponse ou d'appariement tour-réponse, ce modèle traite à la fois les contextes et les réponses comme des séquences de tours lors du calcul des degrés d'appariement entre eux. Pour une paire contexte-réponse, le modèle U2U-IMN encode chaque tour séparément à l'aide de couches récurrentes et d'auto-attention. Ensuite, une interaction globale et bidirectionnelle entre le contexte et la réponse est réalisée à l'aide du mécanisme d'attention pour recueillir les informations d'appariement entre eux. Les distances entre les tours du contexte et ceux de la réponse sont utilisées comme composante a priori lors du calcul des poids d'attention. Enfin, l'agrégation au niveau des phrases et l'agrégation au niveau contexte-réponse sont exécutées successivement pour obtenir le vecteur de caractéristiques destiné à prédire le degré d'appariement. Des expériences menées sur quatre jeux de données publics ont montré que notre méthode proposée surpassait les méthodes de référence sur tous les critères, atteignant une nouvelle performance state-of-the-art et démontrant sa compatibilité transdomaine pour la sélection de réponses multiroues.