il y a 17 jours

NISER : Représentations normalisées d'éléments et de sessions pour gérer le biais de popularité

Priyanka Gupta, Diksha Garg, Pankaj Malhotra, Lovekesh Vig, Gautam Shroff

Résumé

L'objectif des modèles de recommandation basés sur les sessions (SR) est d'utiliser les informations provenant des actions passées (par exemple, les clics sur des articles ou produits) au sein d'une session afin de recommander les articles susceptibles d'être cliqués par l'utilisateur lors de sa prochaine interaction. Récemment, il a été démontré que la séquence des interactions avec les articles au sein d'une session peut être modélisée sous forme de données structurées en graphe, permettant ainsi de mieux capturer les transitions complexes entre les articles. Les réseaux de neurones graphiques (GNN) sont capables d'apprendre des représentations utiles pour ces graphes de sessions, et ont montré leur supériorité par rapport aux modèles séquentiels tels que les réseaux de neurones récurrents [14]. Toutefois, nous observons que ces modèles de recommandation basés sur les GNN souffrent d'un biais de popularité : ils sont biaisés en faveur de la recommandation d'articles populaires, et échouent à recommander efficacement des articles de longue traîne (c’est-à-dire des articles moins populaires ou moins fréquemment interagis). En conséquence, ces modèles se comportent médiocrement face aux nouveaux articles peu populaires qui arrivent quotidiennement dans un environnement en ligne réel. Nous démontrons que ce problème est, en partie, lié à la norme (ou magnitude) des représentations apprises pour les articles et les graphes de sessions (vecteurs d'embedding). Nous proposons une procédure d'entraînement qui atténue ce problème en utilisant des représentations normalisées. Les modèles utilisant des représentations normalisées pour les articles et les graphes de sessions se distinguent nettement : i) pour les articles de longue traîne peu populaires dans un cadre hors ligne, et ii) pour les nouveaux articles peu populaires introduits en temps réel dans un cadre en ligne. En outre, notre approche améliore significativement les résultats des états de l’art existants sur trois jeux de données standard.