Un estimateur efficace de densité de variété pour tous les systèmes de recommandation

De nombreuses méthodes d'apprentissage non supervisé des représentations relèvent de la catégorie des modèles d'apprentissage de similarité. Bien qu'il existe diverses approches spécifiques aux modalités pour différents types de données, une propriété fondamentale de nombreuses méthodes réside dans le fait que les représentations d'entrées similaires sont proches selon une certaine fonction de similarité. Nous proposons EMDE (Efficient Manifold Density Estimator), un cadre exploitant des représentations vectorielles arbitraires possédant la propriété de similarité locale afin de représenter de manière concise des densités de probabilité lisses sur des variétés riemanniennes. Notre représentation approchée présente les propriétés souhaitables d’être de taille fixe et d’admettre une composition additive simple, ce qui la rend particulièrement adaptée à un traitement par réseaux neuronaux — tant comme format d’entrée que de sortie — permettant ainsi de construire des estimateurs conditionnels efficaces. Nous généralisons et reformulons le problème de recommandation multi-modale comme une estimation de densité conditionnelle pondérée sur des variétés. Notre approche permet une intégration triviale de plusieurs types d’interactions, de diverses modalités de données ainsi que de différentes intensités d’interaction, dans tout cadre de recommandation. En appliquant EMDE aux scénarios de recommandation top-k et session-based, nous établissons de nouveaux résultats de l’état de l’art sur plusieurs jeux de données ouverts, tant dans des contextes uni-modaux que multi-modaux.