Command Palette
Search for a command to run...
Modèle CNN à plusieurs tâches pour la prédiction d'attributs
Modèle CNN à plusieurs tâches pour la prédiction d'attributs
Abdulnabi Abrar H. Wang Gang Lu Jiwen Jia Kui
Résumé
Cet article propose un algorithme d'apprentissage multi-tâches conjoint, visant à améliorer la prédiction des attributs dans les images à l’aide de réseaux de neurones convolutifs profonds (CNN). Nous considérons l’apprentissage d’attributs sémantiques binaires à l’aide d’un modèle CNN multi-tâches, dans lequel chaque CNN est chargé de prédire un attribut binaire spécifique. L’apprentissage multi-tâches permet aux modèles CNN de partager simultanément des connaissances visuelles entre différentes catégories d’attributs. Chaque CNN génère ainsi des représentations de caractéristiques spécifiques à l’attribut, puis nous appliquons l’apprentissage multi-tâches sur ces caractéristiques afin de prédire les attributs correspondants. Dans notre cadre multi-tâches, nous proposons une méthode permettant de décomposer les paramètres globaux du modèle en une matrice de tâches latentes et une matrice de combinaison. En outre, les classificateurs sous-échantillonnés peuvent tirer parti des statistiques partagées par d’autres classificateurs afin d’améliorer leurs performances. Une structuration naturelle des attributs est introduite, de sorte que les attributs appartenant à un même groupe sont encouragés à partager davantage de connaissances, tandis que les attributs appartenant à des groupes distincts s’opposent généralement entre eux, entraînant ainsi un partage réduit de connaissances. Nous démontrons l’efficacité de notre méthode sur deux jeux de données populaires d’attributs.