Command Palette
Search for a command to run...
Intervention causale pour la segmentation sémantique faiblement supervisée
Intervention causale pour la segmentation sémantique faiblement supervisée
Dong Zhang Hanwang Zhang Jinhui Tang Xiansheng Hua Qianru Sun
Résumé
Nous proposons un cadre d'inférence causale visant à améliorer la segmentation sémantique faiblement supervisée (WSSS). Plus précisément, notre objectif consiste à générer des pseudo-masques au niveau des pixels de meilleure qualité en n'utilisant que des étiquettes au niveau de l'image — l'étape la plus cruciale dans le cadre de la WSSS. Nous attribuons la cause des frontières ambigües des pseudo-masques à un contexte confondant : par exemple, une classification correcte au niveau de l'image pour les catégories « cheval » et « personne » peut résulter non seulement de la reconnaissance de chaque instance, mais aussi de leur contexte de co-occurrence, ce qui rend difficile pour le modèle (par exemple, via les CAM) de distinguer précisément les frontières. Inspirés par cette observation, nous proposons un modèle causal structurel pour analyser les relations causales entre les images, les contextes et les étiquettes de classe. À partir de ce modèle, nous développons une nouvelle méthode, appelée Ajustement de Contexte (CONTA), visant à éliminer le biais confondant dans la classification au niveau de l'image, afin de fournir des pseudo-masques de meilleure qualité comme vérité terrain pour le modèle de segmentation ultérieur. Sur les jeux de données PASCAL VOC 2012 et MS-COCO, nous démontrons que CONTA améliore significativement diverses méthodes populaires de WSSS, atteignant de nouveaux états de l’art.