HyperAIHyperAI
il y a 9 jours

Amélioration de la calibration pour la reconnaissance à distribution longue

Zhisheng Zhong, Jiequan Cui, Shu Liu, Jiaya Jia
Amélioration de la calibration pour la reconnaissance à distribution longue
Résumé

Les réseaux neuronaux profonds peuvent présenter de mauvaises performances lorsque les jeux de données d’entraînement sont fortement déséquilibrés en termes de classes. Récemment, des méthodes à deux étapes ont été proposées afin de découpler l’apprentissage des représentations et celui du classificateur, afin d’améliorer les performances. Toutefois, un problème crucial demeure : le mauvais calibrage des probabilités prédites. Pour y remédier, nous proposons deux méthodes visant à améliorer à la fois le calibrage et les performances dans ces scénarios. Inspirés du fait que les distributions de probabilités prédites par les classes sont fortement corrélées au nombre d’instances par classe, nous introduisons une lissage orienté par les étiquettes (label-aware smoothing) afin de traiter les degrés variables de surestimation des probabilités par les classes et d’améliorer l’apprentissage du classificateur. En outre, pour atténuer le biais de données entre les deux étapes causé par l’utilisation de différents stratégies d’échantillonnage, nous proposons une normalisation par lots décalée (shifted batch normalization) dans le cadre du découplage. Les méthodes proposées établissent de nouveaux records sur plusieurs benchmarks populaires pour la reconnaissance à longue queue (long-tailed recognition), notamment CIFAR-10-LT, CIFAR-100-LT, ImageNet-LT, Places-LT et iNaturalist 2018. Le code source sera disponible à l’adresse suivante : https://github.com/Jia-Research-Lab/MiSLAS.

Amélioration de la calibration pour la reconnaissance à distribution longue | Articles de recherche récents | HyperAI