HyperAIHyperAI
il y a 2 mois

Représentations Multi-Granularité des Dialogues

Shikib Mehri; Maxine Eskenazi
Représentations Multi-Granularité des Dialogues
Résumé

Les modèles neuronaux de dialogue s'appuient sur des représentations latentes généralisées du langage. Cet article introduit une nouvelle procédure d'entraînement qui apprend explicitement plusieurs représentations du langage à différents niveaux de granularité. L'algorithme d'entraînement multi-granulaire modifie le mécanisme par lequel les réponses candidates négatives sont échantillonnées afin de contrôler la granularité des représentations latentes apprises. Des gains de performance significatifs sont observés dans la tâche de récupération de l'utterance suivante en utilisant à la fois le jeu de données MultiWOZ et le corpus de dialogue Ubuntu. L'analyse démontre de manière significative que plusieurs granularités de représentation sont effectivement apprises, et que l'entraînement multi-granulaire facilite un meilleur transfert vers les tâches en aval.