HyperAIHyperAI

Command Palette

Search for a command to run...

Guidage de l'attention dans les modèles séquence-à-séquence pour la prédiction des actes de dialogue

Pierre Colombo Emile Chapuis Matteo Manica Emmanuel Vignon Giovanna Varni Chloe Clavel

Résumé

La tâche de prédiction des actes dialogiques (DA) à partir de dialogues conversationnels constitue un élément clé dans le développement des agents conversationnels. Une prédiction précise des DA exige une modélisation fine à la fois de la conversation elle-même et des dépendances globales entre les étiquettes. Nous exploitons les approches seq2seq largement utilisées dans la traduction automatique neurale (NMT) afin d’améliorer la modélisation de la séquentialité des étiquettes. Les modèles seq2seq sont connus pour leur capacité à apprendre des dépendances globales complexes, tandis que les approches actuelles basées sur des champs aléatoires conditionnels linéaires (CRF) ne modélisent que des dépendances locales entre étiquettes. Dans ce travail, nous introduisons un modèle seq2seq spécifiquement conçu pour la classification des actes dialogiques, intégrant : un encodeur hiérarchique, un nouveau mécanisme d’attention guidée, ainsi qu’une recherche par faisceau (beam search) appliquée aussi bien à l’entraînement qu’à l’inférence. Contrairement aux états de l’art, notre modèle ne nécessite pas de caractéristiques manuellement conçues et est entraîné de bout en bout. De plus, l’approche proposée atteint un score d’exactitude inégalé de 85 % sur le corpus SwDA, ainsi qu’un score d’exactitude au niveau de l’état de l’art de 91,6 % sur le corpus MRDA.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Guidage de l'attention dans les modèles séquence-à-séquence pour la prédiction des actes de dialogue | Articles | HyperAI