Apprentissage représentation léger pour une recommandation efficace et évolutif

Au cours des dernières décennies, la recommandation est devenue un composant essentiel de nombreux services en ligne, tels que le streaming média ou le commerce électronique. Les avancées récentes en algorithmes, méthodes d’évaluation et jeux de données ont permis des améliorations continues de l’état de l’art. Toutefois, de nombreux défis subsistent pour permettre à ces méthodes de s’échelonner à l’échelle d’internet.La publicité en ligne constitue un terrain d’expérimentation unique pour la recommandation à grande échelle. Chaque jour, des milliards d’utilisateurs interagissent en temps réel avec des millions de produits. Les systèmes conçus pour ce contexte doivent fonctionner de manière fiable à grande échelle. Nous proposons un modèle efficace (LED, pour Lightweight Encoder-Decoder), qui établit un nouveau compromis entre complexité, échelle et performance. Plus précisément, nous démontrons que l’association de la factorisation matricielle à grande échelle avec un ajustement léger des embeddings permet d’atteindre des performances de pointe à grande échelle. Nous fournissons également une description détaillée d’une architecture système, et en montrons le fonctionnement sur une période de deux mois à l’échelle d’internet. Notre conception permet de servir des milliards d’utilisateurs sur des centaines de millions d’articles en quelques millisecondes, en utilisant uniquement des matériels standards.