HyperAIHyperAI
il y a 9 jours

Génération de caractéristiques pour la classification à queue longue

Rahul Vigneswaran, Marc T. Law, Vineeth N. Balasubramanian, Makarand Tapaswi
Génération de caractéristiques pour la classification à queue longue
Résumé

Le monde visuel présente naturellement un déséquilibre dans le nombre d'instances d'objets ou de scènes, conduisant à une distribution en « queue longue » (long-tailed distribution). Ce déséquilibre pose des défis importants aux modèles de classification fondés sur l'apprentissage profond. L'augmentation artificielle (oversampling) des instances des classes de queue constitue une approche courante pour atténuer ce déséquilibre. Toutefois, la faible diversité visuelle des données ainsi générées conduit à un réseau avec une capacité de représentation limitée. Une solution simple consiste à découpler les réseaux de représentation et de classification, en appliquant l'oversampling uniquement à l'entraînement du classificateur. Dans cet article, au lieu de rééchantillonner répétitivement la même image (et donc les mêmes caractéristiques), nous explorons une approche visant à générer des caractéristiques significatives en estimant la distribution des catégories de queue. Inspirés par des travaux récents sur l'apprentissage peu supervisé (few-shot learning), nous construisons des distributions calibrées afin d'échantillonner des caractéristiques supplémentaires, utilisées ensuite pour entraîner le classificateur. À travers plusieurs expériences sur le jeu de données CIFAR-100-LT (à queue longue), avec différents facteurs de déséquilibre, ainsi que sur mini-ImageNet-LT (à queue longue), nous démontrons l'efficacité de notre méthode et établissons un nouveau record d'état de l'art. Nous présentons également une analyse qualitative des caractéristiques générées à l'aide de visualisations t-SNE, ainsi qu'une étude des voisins les plus proches utilisés pour calibrer les distributions des classes de queue. Notre code est disponible à l'adresse suivante : https://github.com/rahulvigneswaran/TailCalibX.

Génération de caractéristiques pour la classification à queue longue | Articles de recherche récents | HyperAI