HyperAIHyperAI

Command Palette

Search for a command to run...

TripleNet : Réseau à Triple Attention pour la Sélection de Réponses Multitour dans les Chatbots Basés sur la Récupération

Wentao Ma; Yiming Cui; Nan Shao; Su He; Wei-Nan Zhang; Ting Liu; Shijin Wang; Guoping Hu

Résumé

Nous considérons que l'importance des différentes énoncés dans le contexte pour la sélection de la réponse dépend généralement de la requête actuelle. Dans cet article, nous proposons un modèle appelé TripleNet pour modéliser pleinement la tâche avec le triplet au lieu du couple utilisé dans les travaux précédents. Le cœur de TripleNet est un nouveau mécanisme d'attention nommé triple attention, qui modélise les relations au sein du triplet à quatre niveaux. Ce nouveau mécanisme met à jour la représentation de chaque élément en fonction de l'attention portée aux deux autres éléments simultanément et symétriquement. Nous faisons correspondre le triplet centré sur la réponse, du niveau caractère au niveau contexte, pour effectuer la prédiction. Les résultats expérimentaux sur deux grands ensembles de données de sélection de réponses multi-tour montrent que le modèle proposé peut surpasser significativement les méthodes les plus avancées actuellement disponibles. Le code source de TripleNet est disponible à l'adresse suivante : https://github.com/wtma/TripleNet


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp