Consistance de l'augmentation auto-supervisée pour l'adaptation de la segmentation sémantique

Nous proposons une approche d’adaptation de domaine pour la segmentation sémantique à la fois pratique et hautement précise. Contrairement aux travaux antérieurs, nous abandonnons l’utilisation d’objectifs adverses coûteux en calcul, de collections de réseaux (ensembles) et de transfert de style. Au lieu de cela, nous utilisons des techniques standard d’augmentation des données — bruit photométrique, retournement et mise à l’échelle — tout en assurant la cohérence des prédictions sémantiques à travers ces transformations d’image. Nous développons ce principe dans un cadre auto-supervisé léger, entraîné sur des étiquettes pseudo-étiquetées co-évoluant, sans nécessiter de phases d’entraînement supplémentaires complexes. Simple à entraîner du point de vue du praticien, notre méthode s’avère remarquablement efficace. Nous obtenons des améliorations significatives par rapport aux performances actuelles de l’état de l’art en segmentation après adaptation, de manière cohérente quel que soit le choix de l’architecture de base ou du scénario d’adaptation.