HyperAIHyperAI
il y a 13 jours

Apprentissage de la mémoire des relations d'entraînement et discursives pour des dialogues cohérents par rapport à la personnalité

Ruijun Chen, Jin Wang, Liang-Chih Yu, Xuejie Zhang
Apprentissage de la mémoire des relations d'entraînement et discursives pour des dialogues cohérents par rapport à la personnalité
Résumé

Le maintien de l’engagement et de la cohérence est particulièrement important dans les systèmes de dialogue. Les travaux existants ont amélioré les performances des systèmes de dialogue en apprenant intentionnellement les personnalités des interlocuteurs grâce à des architectures réseau sophistiquées. Un inconvénient de cette approche réside dans le besoin de corpus personnels étiquetés, souvent difficiles à obtenir. En outre, ces modèles prédisent généralement la prochaine utterance pour générer une réponse, tout en négligeant la cohérence discursive dans l’ensemble de la conversation. Pour remédier à ces limites, cette étude propose une méthode d’apprentissage visant à mémoriser les relations d’entraînement (entailment) et les relations discursives pour les tâches de dialogue cohérente au niveau de la personnalité. Des paires de textes d’entraînement provenant du jeu de données de raisonnement sémantique en langage naturel ont été utilisées pour apprendre des relations d’entraînement latentes comme mémoire externe, via une tâche de génération hypothèse à partir du prémisse. Par ailleurs, une mémoire interne, de structure similaire, a été appliquée à l’information discursive au sein du dialogue. L’imposition de contraintes d’orthogonalité sur ces deux espaces mémoire garantit que les relations d’entraînement latentes restent indépendantes du dialogue. Ces deux mémoires collaborent afin d’obtenir des représentations d’entraînement et discursives pour la génération, permettant ainsi une compréhension plus approfondie à la fois de la cohérence et de la consistance. Des expériences menées sur deux grands jeux de données publics, PersonaChat et DSTC7-AVSD, démontrent l’efficacité de la méthode proposée. Les évaluations automatiques et humaines montrent que le modèle proposé surpasse plusieurs baselines performantes en matière de cohérence de la personnalité et de cohérence de la réponse. Le code source est disponible à l’adresse suivante : https://github.com/Chenrj233/LMEDR.

Apprentissage de la mémoire des relations d'entraînement et discursives pour des dialogues cohérents par rapport à la personnalité | Articles de recherche récents | HyperAI