Laitage de CowMask pour la classification d’images semi-supervisée

La régularisation de cohérence est une technique d’apprentissage semi-supervisé qui sous-tend de nombreux résultats performants en classification avec très peu de données étiquetées. Elle repose sur l’idée d’encourager le modèle appris à être robuste aux perturbations appliquées aux données non étiquetées. Dans ce travail, nous proposons une nouvelle méthode d’augmentation basée sur un masque, appelée CowMask. En utilisant CowMask pour générer des perturbations dans le cadre de la régularisation de cohérence semi-supervisée, nous atteignons un résultat de pointe sur ImageNet avec seulement 10 % de données étiquetées, obtenant une erreur top-5 de 8,76 % et une erreur top-1 de 26,06 %. De plus, cette performance est obtenue grâce à une méthode bien plus simple que de nombreuses alternatives existantes. Nous étudions également en profondeur le comportement de CowMask dans le cadre de l’apprentissage semi-supervisé à l’aide d’expériences à plus petite échelle sur les jeux de données SVHN, CIFAR-10 et CIFAR-100, où nous obtenons des résultats compétitifs avec l’état de l’art, ce qui indique que CowMask est largement applicable. Nous mettons notre code à disposition sous licence open source à l’adresse suivante : https://github.com/google-research/google-research/tree/master/milking_cowmask