Apprentissage Profond sur des Données Catégorielles Multidomaines : Une Étude de Cas sur la Prédiction de la Réponse Utilisateur

La prédiction des réponses des utilisateurs, telles que le taux de clics et le taux de conversion, est cruciale dans de nombreuses applications web, notamment la recherche web, les recommandations personnalisées et la publicité en ligne. Contrairement aux caractéristiques continues et brutes que l'on trouve généralement dans les domaines de l'image et du son, les caractéristiques d'entrée dans l'espace web sont toujours multifield et principalement discrètes et catégorielles, avec des dépendances peu connues. Les principaux modèles de prédiction des réponses des utilisateurs doivent soit se limiter aux modèles linéaires, soit nécessiter la construction manuelle de combinaisons de caractéristiques d'ordre supérieur. Le premier perd la capacité d'explorer les interactions entre les caractéristiques, tandis que le second entraîne un calcul lourd dans l'espace de caractéristiques étendu. Pour résoudre ce problème, nous proposons deux nouveaux modèles utilisant des réseaux neuronaux profonds (DNNs) pour apprendre automatiquement des motifs efficaces à partir des interactions de caractéristiques catégorielles et prédire les clics sur les publicités par les utilisateurs. Pour faire fonctionner nos DNNs efficacement, nous proposons d'utiliser trois méthodes de transformation de caractéristiques : les machines à factorisation (FMs), les machines de Boltzmann restreintes (RBMs) et les auto-encodeurs débruiteurs (DAEs). Cet article présente la structure de nos modèles ainsi que leurs algorithmes d'entraînement efficaces. Les expériences à grande échelle menées avec des données réelles montrent que nos méthodes surpassent les principaux modèles de pointe actuels.