Apprentissage de représentations amélioré pour les systèmes de recommandation conversationnels grâce aux graphes de connaissances et aux modèles linguistiques pré-entraînés

Les systèmes de recommandation conversationnels (CRS) exploitent les interactions en langage naturel et l'historique de dialogue afin d'inférer les préférences des utilisateurs et de fournir des recommandations précises. En raison du contexte de conversation limité et du manque de connaissances de fond, les CRS existants s'appuient sur des sources externes telles que les graphes de connaissances pour enrichir le contexte et modéliser les entités en fonction de leurs relations mutuelles. Toutefois, ces approches négligent l'information intrinsèque riche contenue dans les entités elles-mêmes. Pour remédier à ce défaut, nous proposons le cadre d'apprentissage des représentations d'entités enrichies par les connaissances (KERL), qui exploite à la fois un graphe de connaissances et un modèle linguistique pré-entraîné afin d'améliorer la compréhension sémantique des entités dans les CRS. Dans notre cadre KERL, les descriptions textuelles des entités sont encodées à l'aide d'un modèle linguistique pré-entraîné, tandis qu'un graphe de connaissances contribue à renforcer leurs représentations. Nous utilisons également une encodage positionnel pour capturer efficacement l'information temporelle des entités au cours d'une conversation. La représentation améliorée des entités est ensuite utilisée pour concevoir un composant de recommandation qui fusionne les représentations d'entités et contextuelles afin de produire des recommandations plus éclairées, ainsi qu'un composant de dialogue capable de générer des informations pertinentes liées aux entités dans le texte de réponse. Un graphe de connaissances de haute qualité, doté de descriptions d'entités alignées, a été construit pour faciliter cette étude, nommé le Wiki Movie Knowledge Graph (WikiMKG). Les résultats expérimentaux montrent que KERL atteint des performances de pointe dans les tâches de recommandation et de génération de réponses.