RSG : Un module simple mais efficace pour l'apprentissage des jeux de données déséquilibrés

Les jeux de données déséquilibrés sont courants dans la pratique et posent un défi majeur pour l'entraînement des modèles de réseaux neuronaux profonds, en particulier en ce qui concerne la généralisation sur les classes rares. Dans ce travail, nous proposons un nouveau générateur d’échantillons pour classes rares (RSG, Rare-class Sample Generator) afin de résoudre ce problème. Le RSG vise à générer de nouveaux échantillons pour les classes rares durant l’entraînement, et présente notamment les avantages suivants : (1) il est facile à utiliser et hautement polyvalent, car il peut être intégré aisément à tout type de réseau neuronal convolutif, et fonctionne efficacement en combinaison avec différentes fonctions de perte ; (2) il n’est utilisé qu’en phase d’entraînement, sans imposer de charge supplémentaire aux réseaux neuronaux profonds en phase de test. Des évaluations expérimentales étendues confirment l’efficacité du RSG. En outre, en exploitant le RSG, nous obtenons des résultats compétitifs sur Imbalanced CIFAR, ainsi que des résultats état-de-l’art nouveaux sur Places-LT, ImageNet-LT et iNaturalist 2018. Le code source est disponible à l’adresse suivante : https://github.com/Jianf-Wang/RSG.