HyperAIHyperAI

Command Palette

Search for a command to run...

Optimisation de l'ensemble de caractéristiques pour la prédiction du taux de clic

Fuyuan Lyu Xing Tang Dugang Liu Liang Chen Xiuqiang He Xue Liu

Résumé

Les modèles de prédiction du taux de clic (CTR) transforment les caractéristiques en vecteurs latents et explorent les interactions possibles entre caractéristiques afin d’améliorer les performances sur la base de l’ensemble d’entrée. Par conséquent, lors de la sélection d’un ensemble optimal de caractéristiques, il convient de prendre en compte à la fois l’impact des caractéristiques elles-mêmes et leurs interactions. Toutefois, la plupart des travaux antérieurs se concentrent soit sur la sélection des champs de caractéristiques, soit sur la sélection d’interactions entre caractéristiques à partir d’un ensemble fixe, sans optimiser conjointement les deux. La première approche restreint l’espace de recherche aux champs de caractéristiques, ce qui est trop grossier pour identifier des caractéristiques subtiles. Elle ne filtre pas non plus les interactions inutiles, entraînant ainsi des coûts computationnels plus élevés et une dégradation des performances du modèle. La seconde approche identifie des interactions pertinentes parmi toutes les caractéristiques disponibles, ce qui conduit à l’intégration dans l’ensemble de nombreuses caractéristiques redondantes. Dans cet article, nous proposons une méthode novatrice nommée OptFS pour résoudre ces problèmes. Pour unifier la sélection des caractéristiques et de leurs interactions, nous décomposons la sélection de chaque interaction en la sélection de deux caractéristiques corrélées. Cette décomposition permet au modèle d’être entraîné de manière end-to-end, quelles que soient les opérations d’interaction entre caractéristiques. En adoptant un espace de recherche au niveau des caractéristiques, nous introduisons une porte apprenable pour déterminer si chaque caractéristique doit être incluse dans l’ensemble. Étant donné l’immensité de l’espace de recherche, nous développons un schéma d’entraînement par continuation pour apprendre ces portes. Ainsi, OptFS génère un ensemble de caractéristiques ne contenant que celles qui améliorent réellement les résultats de prédiction finale. Expérimentalement, nous évaluons OptFS sur trois jeux de données publics, démontrant que cette méthode permet d’optimiser les ensembles de caractéristiques, d’améliorer les performances du modèle, et de réduire simultanément les coûts de stockage et computationnels.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Optimisation de l'ensemble de caractéristiques pour la prédiction du taux de clic | Articles | HyperAI