La segmentation sémantique semi-supervisée nécessite des perturbations fortes et variées.

La régularisation de cohérence décrit une classe d'approches qui ont permis des avancées majeures dans les problèmes de classification semi-supervisée. Les travaux antérieurs ont établi l'hypothèse de clustering – selon laquelle la distribution des données se compose de clusters uniformes d'échantillons séparés par des régions à faible densité – comme essentielle à son succès. Nous analysons le problème de segmentation sémantique et constatons que sa distribution ne présente pas de régions à faible densité séparant les classes, ce qui explique pourquoi la segmentation sémantique semi-supervisée est un problème difficile, avec seulement quelques rapports de réussite. Nous identifions ensuite le choix de l'augmentation comme étant crucial pour obtenir des performances fiables en l'absence de telles régions à faible densité. Nous trouvons que des variantes adaptées des techniques d'augmentation CutOut et CutMix récemment proposées permettent d'obtenir des résultats de pointe en segmentation sémantique semi-supervisée sur des jeux de données standards. De plus, compte tenu de sa nature difficile, nous proposons que la segmentation sémantique serve d'épreuve acide efficace pour évaluer les régulariseurs semi-supervisés. Implémentation disponible à : https://github.com/Britefury/cutmix-semisup-seg.