Reconnaissance des classes longues à l’aide d’experts équilibrés par classe

L’apprentissage profond permet d’obtenir des performances remarquables en reconnaissance d’images à l’aide de jeux de données artificiellement équilibrés à grande échelle. Toutefois, les jeux de données du monde réel présentent des distributions fortement déséquilibrées entre les classes, ce qui pose deux défis majeurs : un déséquilibre relatif entre les classes, ainsi qu’une rareté des données pour les classes moyennement ou peu représentées (medium-shot ou few-shot). Dans ce travail, nous abordons le problème de la reconnaissance à queue longue (long-tailed recognition), dans lequel le jeu d’entraînement est fortement déséquilibré tandis que le jeu de test reste équilibré. Contrairement aux approches existantes fondées sur le rééchantillonnage des données, l’apprentissage sensible au coût, l’exploitation en ligne des exemples difficiles, la réorganisation de la fonction de perte ou encore les modèles basés sur la mémoire, nous proposons une combinaison d’experts équilibrés par classe, qui exploite les forces de classifieurs diversifiés. Notre ensemble d’experts équilibrés par classe atteint des résultats proches de l’état de l’art, et un ensemble étendu établit un nouveau record sur deux benchmarks pour la reconnaissance à queue longue. Nous menons des expériences approfondies afin d’analyser la performance de ces ensembles, et découvrons que, dans les jeux de données modernes à grande échelle, le déséquilibre relatif constitue un problème plus difficile que la rareté des données. Le code d’entraînement et d’évaluation est disponible à l’adresse suivante : https://github.com/ssfootball04/class-balanced-experts.