DeepFM : Un réseau neuronal basé sur la machine factorielle pour la prédiction du taux de clic (CTR)

L'apprentissage des interactions de caractéristiques complexes derrière les comportements des utilisateurs est crucial pour maximiser le taux de clic (CTR) dans les systèmes de recommandation. Malgré les progrès significatifs réalisés, les méthodes existantes semblent avoir une forte tendance à privilégier les interactions d'ordre bas ou élevé, ou nécessitent un travail d'ingénierie des caractéristiques réalisé par des experts. Dans cet article, nous montrons qu'il est possible de développer un modèle d'apprentissage global qui met l'accent à la fois sur les interactions de caractéristiques d'ordre bas et élevé. Le modèle proposé, DeepFM, combine la puissance des machines factorisées pour la recommandation et l'apprentissage profond pour l'extraction des caractéristiques dans une nouvelle architecture de réseau neuronal. Comparé au dernier modèle Wide & Deep de Google, DeepFM dispose d'une entrée partagée pour ses parties « large » et « profonde », sans nécessiter d'ingénierie des caractéristiques en plus des caractéristiques brutes. Des expériences exhaustives sont menées pour démontrer l'efficacité et l'efficience de DeepFM par rapport aux modèles existants pour la prédiction du CTR, tant sur des données de référence que sur des données commerciales.