Étiquetage doux pour la segmentation sémantique : Apporter une cohérence au redimensionnement des étiquettes

Dans la segmentation sémantique, l’échantillonnage réduit des données d’entraînement est couramment appliqué en raison de contraintes de ressources, de la nécessité d’adapter la taille des images à l’entrée du modèle, ou encore d’améliorer l’augmentation des données. Cet échantillonnage réduit utilise généralement des stratégies différentes pour les données d’image et les étiquettes annotées. Ce désalignement entraîne des incohérences entre les images couleur échantillonnées et les images d’étiquettes, ce qui provoque une dégradation significative des performances d’entraînement avec l’augmentation du facteur d’échantillonnage. Dans cet article, nous proposons de combiner les stratégies d’échantillonnage réduit pour les données d’image et les étiquettes d’entraînement. À cette fin, nous introduisons un cadre novateur pour l’échantillonnage réduit des étiquettes basé sur le concept d’étiquetage doux (soft-labeling), qui préserve de manière plus efficace les informations d’étiquettes après l’échantillonnage. Ce cadre permet ainsi une alignement complet des étiquettes douces avec les données d’image, en préservant la distribution des pixels échantillonnés. Par ailleurs, cette approche génère des annotations fiables pour les classes sémantiques sous-représentées. Ensemble, ces avantages permettent d’entraîner des modèles performants à des résolutions plus faibles. Les expérimentations montrent que notre méthode surpasse les autres stratégies d’échantillonnage réduit. De plus, elle atteint des performances de pointe sur des benchmarks standards, tout en utilisant significativement moins de ressources computationnelles que les approches les plus avancées. Cette proposition ouvre ainsi la voie à une recherche compétitive en segmentation sémantique dans des conditions de contraintes de ressources.