HyperAIHyperAI
il y a 2 mois

Apprentissage Profond de la Distribution des Étiquettes avec Ambiguïté des Étiquettes

Bin-Bin Gao; Chao Xing; Chen-Wei Xie; Jianxin Wu; Xin Geng
Apprentissage Profond de la Distribution des Étiquettes avec Ambiguïté des Étiquettes
Résumé

Les Réseaux Neuronaux Convolutifs (ConvNets) ont obtenu d'excellentes performances de reconnaissance dans diverses tâches de reconnaissance visuelle. Un grand ensemble d'entraînement étiqueté est l'un des facteurs les plus importants pour leur succès. Cependant, il est difficile de collecter un nombre suffisant d'images d'entraînement avec des étiquettes précises dans certains domaines tels que l'estimation de l'âge apparent, l'estimation de la pose de la tête, la classification multi-étiquette et la segmentation sémantique. Heureusement, il existe une information ambiguë parmi les étiquettes, ce qui rend ces tâches différentes de la classification traditionnelle. Sur cette base, nous transformons l'étiquette de chaque image en une distribution d'étiquettes discrète et apprenons cette distribution en minimisant une divergence de Kullback-Leibler entre les distributions d'étiquettes prédites et réelles à l'aide de ConvNets profonds. La méthode proposée DLDL (Deep Label Distribution Learning) utilise efficacement l'ambiguïté des étiquettes tant dans l'apprentissage des caractéristiques que dans celui du classifieur, ce qui aide à prévenir le surapprentissage même lorsque l'ensemble d'entraînement est petit. Les résultats expérimentaux montrent que notre approche produit des résultats significativement meilleurs que les méthodes de pointe pour l'estimation de l'âge et la pose de la tête. En même temps, elle améliore également les performances de reconnaissance pour les tâches de classification multi-étiquette et de segmentation sémantique.

Apprentissage Profond de la Distribution des Étiquettes avec Ambiguïté des Étiquettes | Articles de recherche récents | HyperAI