HyperAIHyperAI
il y a 3 mois

CUDA : Programme d'augmentation de données pour la reconnaissance des classes déséquilibrées

Sumyeong Ahn, Jongwoo Ko, Se-Young Yun
CUDA : Programme d'augmentation de données pour la reconnaissance des classes déséquilibrées
Résumé

Les problèmes d’imbalanced class se produisent fréquemment dans les tâches du monde réel, et les algorithmes classiques d’apprentissage profond sont bien connus pour leur dégradation de performance sur des jeux de données d’entraînement déséquilibrés. Pour atténuer ce problème, de nombreuses approches visent à équilibrer les classes en répésant ou en répésant les échantillons d’entraînement par pondération. Ces méthodes d’équilibrage renforcent l’impact des classes minoritaires et réduisent l’influence des classes majoritaires sur la sortie des modèles. Toutefois, les représentations extraites peuvent être de mauvaise qualité en raison du nombre limité d’échantillons minoritaires. Pour surmonter cette limitation, plusieurs méthodes ont été développées afin d’enrichir les représentations des classes minoritaires en exploitant les caractéristiques des classes majoritaires. Malgré les nombreuses études récentes, aucune analyse approfondie n’a été menée concernant la détermination des classes à augmenter ni la force optimale d’augmentation. Dans cette étude, nous analysons tout d’abord la corrélation entre le degré d’augmentation et la performance par classe, et constatons que le degré d’augmentation approprié doit être attribué de manière adaptée à chaque classe afin de réduire efficacement le déséquilibre de classe. Inspirés par cette observation, nous proposons un nouveau curriculum simple et efficace, conçu pour déterminer la force d’augmentation adaptée par classe, appelé CUDA : CUrriculum of Data Augmentation for long-tailed recognition. CUDA peut être facilement intégré aux méthodes existantes de reconnaissance à longue queue. Nos expériences montrent que CUDA améliore significativement la généralisation par rapport à l’état de l’art sur diverses bases de données déséquilibrées, notamment CIFAR-100-LT, ImageNet-LT et iNaturalist 2018.

CUDA : Programme d'augmentation de données pour la reconnaissance des classes déséquilibrées | Articles de recherche | HyperAI