ECLARE : Classification Extrême avec Corrélations de Graphe d'Étiquettes

La classification extrême profonde (XC) vise à former des architectures profondes capables d'attribuer à un point de données l'ensemble de ses étiquettes les plus pertinentes parmi un ensemble d'étiquettes extrêmement vaste. L'utilité principale de la XC réside dans la prédiction d'étiquettes qui sont rarement observées lors de l'entraînement. Ces étiquettes rares sont essentielles pour des recommandations personnalisées qui peuvent ravir et surprendre l'utilisateur. Cependant, le grand nombre d'étiquettes rares et la petite quantité de données d'entraînement par étiquette rare posent des défis statistiques et computationnels importants. Les méthodes actuelles de XC profonde tentent de remédier à cela en intégrant des descriptions textuelles des étiquettes, mais ne résolvent pas adéquatement le problème. Cet article présente ECLARE, une architecture d'apprentissage profond évolutive qui intègre non seulement le texte des étiquettes, mais aussi leurs corrélations, pour offrir des prédictions précises en temps réel en quelques millisecondes. Les contributions principales d'ECLARE incluent une architecture sobre et des techniques évolutives pour former des modèles profonds ainsi que des graphes de corrélations d'étiquettes à l'échelle de millions d'étiquettes. En particulier, ECLARE offre des prédictions qui sont 2 à 14 % plus précises, tant sur des jeux de données de référence publiquement disponibles que sur des jeux de données propriétaires pour une tâche de recommandation de produits connexes issue du moteur de recherche Bing. Le code source d'ECLARE est disponible à l'adresse suivante : https://github.com/Extreme-classification/ECLARE.