Réexaminer la cohérence faible à forte dans la segmentation sémantique semi-supervisée

Dans cette étude, nous réexaminons le cadre de cohérence faible-forte, popularisé par FixMatch dans le domaine de la classification semi-supervisée, où la prédiction d'une image légèrement perturbée sert de supervision à sa version fortement perturbée. De manière intrigante, nous constatons que ce pipeline simple obtient déjà des résultats compétitifs comparés aux travaux avancés récents lorsqu'il est transféré à notre scénario de segmentation. Cependant, son succès repose fortement sur la conception manuelle de fortes augmentations de données, qui peut être limitée et insuffisante pour explorer un espace de perturbation plus large. Motivés par cette observation, nous proposons un flux d'auxiliaire de perturbation des caractéristiques comme complément, conduisant à une expansion de l'espace de perturbation. Par ailleurs, pour explorer suffisamment les augmentations au niveau des images originales, nous présentons une technique de perturbation à double flux, permettant que deux vues fortes soient simultanément guidées par une vue faible commune. En conséquence, notre approche globale de Perturbations Unifiées à Double Flux (UniMatch) dépasse significativement toutes les méthodes existantes selon tous les protocoles d'évaluation sur les benchmarks Pascal, Cityscapes et COCO. Sa supériorité est également démontrée dans l'interprétation des images télédétectées et l'analyse des images médicales. Nous espérons que notre reproduction de FixMatch et nos résultats pourront inspirer davantage d'études futures. Le code source et les journaux sont disponibles à l'adresse suivante : https://github.com/LiheYoung/UniMatch.