TFNet : Interaction Multisémantique des Caractéristiques pour la Prédiction du Taux de Clic (CTR)

La prédiction du taux de clic (CTR) joue un rôle central dans le domaine de la publicité computationnelle et des systèmes de recommandation. Plusieurs méthodes ont été proposées dans ce domaine, telles que la régression logistique (LR), les machines à facteurs (FM), ainsi que des approches basées sur l’apprentissage profond comme Wide & Deep, les machines à facteurs neurales (NFM) et DeepFM. Toutefois, ces approches utilisent généralement le produit scalaire entre chaque paire de caractéristiques, négligeant ainsi les espaces sémantiques différents dans les interactions entre caractéristiques. Dans ce travail, nous proposons un nouveau modèle, le réseau d’interaction de caractéristiques basé sur les tenseurs (TFNet), qui introduit un tenseur opératoire pour modéliser les interactions entre caractéristiques à l’aide de matrices à plusieurs tranches dans plusieurs espaces sémantiques. Des expérimentations approfondies en mode hors ligne et en ligne démontrent que TFNet : 1) surpasser les méthodes de référence sur les jeux de données typiques Criteo et Avazu ; 2) permet une amélioration significative du revenu et du taux de clic lors d’essais A/B en ligne au sein du plus grand système de recommandation d’applications chinois, Tencent MyApp.