DynaSeg : Une Méthode de Fusion Dynamique Profonde pour le Segmentation d'Images Non Supervisée Intégrant la Similarité des Caractéristiques et la Continuité Spatiale

Notre travail aborde le défi fondamental de la segmentation d'images en vision par ordinateur, qui est crucial pour diverses applications. Bien que les méthodes supervisées montrent une efficacité, leur dépendance à des annotations au niveau des pixels étendues limite leur évolutivité. Nous présentons DynaSeg, une nouvelle approche de segmentation d'images non supervisée qui surmonte le défi d'équilibrer la similarité des caractéristiques et la continuité spatiale sans nécessiter un ajustement intensif des hyperparamètres. Contrairement aux méthodes traditionnelles, DynaSeg utilise un schéma de pondération dynamique qui automatise l'ajustement des paramètres, s'adapte de manière flexible aux caractéristiques des images et facilite l'intégration facile avec d'autres réseaux de segmentation. En intégrant une phase de Score Silhouette, DynaSeg prévient les échecs dus à une sous-segmentation où le nombre de clusters prédits pourrait converger vers un seul. DynaSeg utilise l'extraction de caractéristiques basée sur les CNN (Convolutional Neural Networks) et les ResNet pré-entraînées, ce qui le rend plus efficace sur le plan computationnel et plus simple que d'autres modèles complexes. Les résultats expérimentaux mettent en évidence des performances de pointe, avec une amélioration du mIOU (mean Intersection over Union) de 12,2 % et 14,12 % par rapport aux approches actuelles de segmentation non supervisée sur les jeux de données COCO-All et COCO-Stuff, respectivement. Nous fournissons des résultats qualitatifs et quantitatifs sur cinq jeux de données de référence, démontrant l'efficacité de l'approche proposée. Le code est disponible à l'adresse suivante : https://github.com/RyersonMultimediaLab/DynaSeg