Dense FixMatch : une méthode simple d'apprentissage semi-supervisé pour les tâches de prédiction par pixel

Nous proposons Dense FixMatch, une méthode simple pour l’apprentissage semi-supervisé en ligne des tâches de prédiction dense et structurée, combinant la pseudo-étiquetage et la régularisation par cohérence via une augmentation de données forte. Nous rendons possible l’application de FixMatch à des problèmes d’apprentissage semi-supervisé au-delà de la classification d’images en introduisant une opération d’alignement sur les pseudo-étiquettes. Cela nous permet de conserver toute la puissance des pipelines d’augmentation de données, y compris les transformations géométriques. Nous évaluons notre approche sur la segmentation sémantique semi-supervisée sur Cityscapes et Pascal VOC, avec différentes proportions de données étiquetées, et menons une analyse des choix architecturaux et des hyperparamètres. Dense FixMatch améliore significativement les résultats par rapport à l’apprentissage supervisé utilisant uniquement des données étiquetées, en approchant les performances obtenues avec un quart seulement des échantillons étiquetés.