Segmentation sémantique non supervisée
La segmentation sémantique non supervisée est une tâche importante en vision par ordinateur qui vise à classer chaque pixel d'une image grâce à l'apprentissage de modèles sans s'appuyer sur des données d'annotation de vérité terrain. L'objectif de cette tâche est de permettre au modèle de reconnaître et de distinguer automatiquement différentes catégories d'objets dans l'image, afin d'atteindre une compréhension fine du contenu de l'image. La segmentation sémantique non supervisée présente une valeur considérable dans des applications telles que la conduite autonome, l'analyse d'images médicales et la compréhension des scènes, car elle peut réduire considérablement les coûts et le temps associés à l'annotation manuelle.
COCO-Stuff-27
CAUSE (ViT-B/8)
Cityscapes test
STEGO
PASCAL VOC 2012 val
CAUSE (ViT-B/8)
Potsdam-3
PriMaPs-EM+HP (DINO ViT-B/8)
COCO-Stuff-3
IIC
ImageNet-S-50
PASS
COCO-Stuff-171
CAUSE-TR (ViT-S/8)
COCO-Stuff-81
CAUSE-TR (ViT-S/8)
SUIM
DatUS (ViT-B/8) + OC
COCO-Stuff-15
IIC
Cityscapes val
Segmenter ViT-S/16
Nighttime Driving
ImageNet-S
ImageNet-S-300
PASS
ACDC (Adverse Conditions Dataset with Correspondences)
Segmenter ViT-S/16
COCO-Persons
COCO-All
Dark Zurich