Classement des réponses basé sur des représentations interactives profondes de multiples types dans les dialogues basés sur la récupération
La construction d’un système de dialogue intelligent capable de sélectionner une réponse appropriée en fonction d’un contexte multi-tours soulève trois défis majeurs : (1) le sens d’un couple contexte-réponse repose sur des unités linguistiques à différentes granularités (par exemple, mots, expressions, sous-phrases, etc.) ; (2) les dépendances locales (par exemple, dans un voisinage restreint autour d’un mot) et les dépendances à longue portée (par exemple, entre des mots situés dans le contexte et la réponse) peuvent coexister dans les données de dialogue ; (3) la relation entre le contexte et la candidate de réponse repose parfois sur plusieurs indices sémantiques pertinents, ou sur des indices sémantiques relativement implicites dans certains cas réels. Toutefois, les approches existantes encodent généralement le dialogue à l’aide d’une représentation monotype, et les processus d’interaction entre le contexte et la candidate de réponse sont réalisés de manière relativement superficielle, ce qui peut entraîner une compréhension insuffisante du contenu du dialogue et entraver la reconnaissance de la pertinence sémantique entre le contexte et la réponse. Pour relever ces défis, nous proposons un cadre de représentation [K]-interaction [L]-correspondance, qui exploite divers types de représentations interactives profondes afin de construire des modèles de correspondance contexte-réponse pour la sélection de réponses. Plus précisément, nous construisons différentes types de représentations pour les paires énoncé-réponse, que nous approfondissons par encodage alterné et interaction. Grâce à cette approche, le modèle peut modéliser efficacement les relations entre éléments voisins, les motifs phraséologiques et les dépendances à longue portée tout au long du processus de représentation, et effectuer une prédiction plus précise grâce à plusieurs couches d’interactions entre le contexte et la réponse. Les résultats expérimentaux sur trois benchmarks publics montrent que le modèle proposé surpasse significativement les modèles conventionnels de correspondance contexte-réponse précédents, et atteint des performances légèrement supérieures à celles du modèle BERT pour la sélection de réponses multi-tours dans les systèmes de dialogue basés sur la récupération.