Apprentissage large et profond pour les systèmes de recommandation

Les modèles linéaires généralisés avec des transformations non linéaires de caractéristiques sont largement utilisés pour les problèmes de régression et de classification à grande échelle avec des entrées clairsemées. La mémorisation des interactions de caractéristiques grâce à un ensemble étendu de transformations de produit croisé est efficace et interprétable, tandis que la généralisation nécessite davantage d'efforts en ingénierie des caractéristiques. Avec moins d'ingénierie des caractéristiques, les réseaux neuronaux profonds peuvent généraliser mieux aux combinaisons de caractéristiques inconnues grâce aux plongements (embeddings) denses à faible dimension appris pour les caractéristiques clairsemées. Cependant, les réseaux neuronaux profonds avec des plongements peuvent sur-généraliser et recommander des éléments moins pertinents lorsque les interactions utilisateur-élément sont clairsemées et de rang élevé. Dans cet article, nous présentons l'apprentissage Wide & Deep—des modèles linéaires larges et des réseaux neuronaux profonds entraînés conjointement—pour combiner les avantages de la mémorisation et de la généralisation dans les systèmes de recommandation. Nous avons industrialisé et évalué le système sur Google Play, une boutique d'applications mobiles commerciale comptant plus d'un milliard d'utilisateurs actifs et plus d'un million d'applications. Les résultats des expérimentations en ligne montrent que Wide & Deep a considérablement augmenté l'acquisition d'applications par rapport aux modèles uniquement larges ou uniquement profonds. Nous avons également rendu notre implémentation open source dans TensorFlow.