HyperAIHyperAI
il y a 11 jours

Amélioration des GANs pour les données à queue longue par régularisation spectrale par groupe

Harsh Rangwani, Naman Jaswani, Tejan Karmali, Varun Jampani, R. Venkatesh Babu
Amélioration des GANs pour les données à queue longue par régularisation spectrale par groupe
Résumé

L’apprentissage profond à queue longue vise à entraîner des réseaux profonds utiles sur des distributions déséquilibrées du monde réel, dans lesquelles la majorité des étiquettes des classes de queue sont associées à un petit nombre d’échantillons. De nombreuses études ont été menées afin d’entraîner des modèles discriminatifs pour la reconnaissance visuelle sur des distributions à queue longue. En revanche, nous nous concentrons sur l’entraînement de réseaux génératifs adversariaux conditionnels (cGAN), une catégorie de modèles de génération d’images, sur des distributions à queue longue. Nous constatons que, tout comme dans la reconnaissance, les méthodes de pointe pour la génération d’images souffrent également d’une dégradation des performances sur les classes de queue. Cette dégradation est principalement due à un effondrement de mode spécifique à la classe pour les classes de queue, phénomène que nous observons corrélé à une explosion spectrale de la matrice de paramètres conditionnels. Nous proposons un nouveau régulariseur par groupe spectral (gSR) qui empêche l’explosion spectrale, atténuant ainsi l’effondrement de mode et permettant une génération d’images diversifiées et crédibles, même pour les classes de queue. Nous montrons que gSR s’associe efficacement aux techniques existantes d’augmentation et de régularisation, conduisant à des performances de génération d’images de pointe sur des données à queue longue. Des expériences étendues démontrent l’efficacité de notre régulariseur sur des jeux de données à queue longue présentant différents degrés de déséquilibre.

Amélioration des GANs pour les données à queue longue par régularisation spectrale par groupe | Articles de recherche récents | HyperAI