HyperAIHyperAI
il y a 2 mois

TripleNet : Réseau à Triple Attention pour la Sélection de Réponses Multitour dans les Chatbots Basés sur la Récupération

Wentao Ma; Yiming Cui; Nan Shao; Su He; Wei-Nan Zhang; Ting Liu; Shijin Wang; Guoping Hu
TripleNet : Réseau à Triple Attention pour la Sélection de Réponses Multitour dans les Chatbots Basés sur la Récupération
Résumé

Nous considérons que l'importance des différentes énoncés dans le contexte pour la sélection de la réponse dépend généralement de la requête actuelle. Dans cet article, nous proposons un modèle appelé TripleNet pour modéliser pleinement la tâche avec le triplet au lieu du couple utilisé dans les travaux précédents. Le cœur de TripleNet est un nouveau mécanisme d'attention nommé triple attention, qui modélise les relations au sein du triplet à quatre niveaux. Ce nouveau mécanisme met à jour la représentation de chaque élément en fonction de l'attention portée aux deux autres éléments simultanément et symétriquement. Nous faisons correspondre le triplet centré sur la réponse, du niveau caractère au niveau contexte, pour effectuer la prédiction. Les résultats expérimentaux sur deux grands ensembles de données de sélection de réponses multi-tour montrent que le modèle proposé peut surpasser significativement les méthodes les plus avancées actuellement disponibles. Le code source de TripleNet est disponible à l'adresse suivante : https://github.com/wtma/TripleNet