Sur la normalisation des caractéristiques et l'augmentation des données

Les moments (à savoir, la moyenne et l’écart-type) des caractéristiques latentes sont fréquemment supprimés comme bruit lors de l’entraînement des modèles de reconnaissance d’images, afin d’améliorer la stabilité et de réduire le temps d’entraînement. Toutefois, dans le domaine de la génération d’images, les moments jouent un rôle bien plus central. Des études ont montré que les moments extraits de la normalisation par instance et de la normalisation positionnelle permettent de capturer de manière approximative les informations de style et de forme d’une image. Contrairement à leur élimination, ces moments s’avèrent essentiels au processus de génération. Dans cet article, nous proposons une méthode appelée Moment Exchange, une technique d’augmentation de données implicite qui incite le modèle à exploiter également les informations de moments dans les modèles de reconnaissance. Plus précisément, nous remplaçons les moments des caractéristiques apprises d’une image d’entraînement par ceux d’une autre image, tout en interpolant également les étiquettes cibles — forçant ainsi le modèle à extraire un signal d’apprentissage à partir des moments, en plus des caractéristiques normalisées. Étant donné que notre approche est rapide, opère entièrement dans l’espace des caractéristiques et introduit des signaux différents de ceux des méthodes existantes, elle peut être efficacement combinée avec les approches d’augmentation déjà disponibles. Nous démontrons son efficacité sur plusieurs jeux de données de référence pour la reconnaissance, où elle améliore de manière remarquablement cohérente la capacité de généralisation de réseaux de base hautement performants.