HyperAIHyperAI
il y a 9 jours

Bruit pur au secours des données insuffisantes : amélioration de la classification déséquilibrée par l'entraînement sur des images bruitées aléatoires

Shiran Zada, Itay Benou, Michal Irani
Bruit pur au secours des données insuffisantes : amélioration de la classification déséquilibrée par l'entraînement sur des images bruitées aléatoires
Résumé

Malgré les progrès remarquables réalisés sur les tâches de reconnaissance visuelle, les réseaux neuronaux profonds peinent encore à généraliser efficacement lorsque les données d'entraînement sont rares ou fortement déséquilibrées, les rendant particulièrement vulnérables aux exemples du monde réel. Dans cet article, nous proposons une méthode surprenamment simple mais extrêmement efficace pour atténuer cette limitation : l’utilisation d’images bruitées pures comme données d’entraînement supplémentaires. Contrairement à l’utilisation courante du bruit additif ou du bruit adversarial pour la augmentation de données, nous adoptons une perspective entièrement différente en entraînant directement sur des images constituées de bruit aléatoire pur. Nous introduisons une nouvelle couche de normalisation par lots orientée vers la distribution, appelée DAR-BN (Distribution-Aware Routing Batch Normalization), qui permet d’entraîner simultanément sur des images naturelles et sur des images de bruit pur au sein du même réseau. Cette approche favorise la généralisation et réduit le surapprentissage. La méthode proposée améliore de manière significative les performances de classification déséquilibrée, atteignant des résultats de pointe sur une large variété de jeux de données de classification d’images à queue longue (CIFAR-10-LT, CIFAR-100-LT, ImageNet-LT, Places-LT et CelebA-5). En outre, cette méthode est extrêmement simple à mettre en œuvre et peut servir de nouvel outil général d’augmentation de données (complémentaire aux méthodes existantes), intégrable dans n’importe quel schéma d’entraînement. Elle ne nécessite ni génération spécialisée de données, ni procédures d’entraînement particulières, préservant ainsi la rapidité et l’efficacité du processus d’apprentissage.