Emboîtements non linéaires sensibles aux attributs des caractéristiques de graphe
Dans les ensembles de données de recommandation très creux, les attributs des utilisateurs — tels que l’âge, le sexe ou le lieu de résidence — ainsi que les attributs des items — par exemple, dans le cas des films, le genre, l’année de sortie ou le réalisateur — peuvent améliorer la précision de la recommandation, en particulier pour les utilisateurs et les items ayant peu d’évaluations. Bien que la plupart des modèles de recommandation puissent être étendus pour intégrer ces attributs, leurs architectures deviennent généralement plus complexes. Si les attributs des items sont souvent facilement disponibles, ceux des utilisateurs sont souvent rares, en raison de préoccupations liées à la vie privée ou tout simplement parce qu’ils ne sont pas pertinents pour le processus opérationnel en cours.Dans cet article, nous abordons ces deux défis des systèmes de recommandation sensibles aux attributs en proposant un modèle simple qui embarque conjointement utilisateurs et items dans un espace latent commun, de manière similaire à une factorisation matricielle classique, mais avec une construction non linéaire des caractéristiques latentes permettant d’intégrer de manière fluide les attributs des utilisateurs, des items, ou les deux (GraphRec). Pour faire face au deuxième problème — le manque d’attributs —, le modèle proposé traite la relation utilisateur-item comme un graphe biparti et construit des attributs génériques pour les utilisateurs et les items à partir du laplacien du graphe d’occurrence conjointe utilisateur-item, ce qui ne nécessite aucune information complémentaire externe, uniquement la matrice d’évaluations elle-même. Sur trois jeux de données de recommandation, nous montrons que GraphRec surpasse significativement les systèmes de recommandation actuellement les plus performants, tant dans les approches sensibles aux attributs que dans les approches sensibles au contenu, même en l’absence de toute information complémentaire.