FREDOM : Approche d’adaptation de domaine équitable pour la compréhension sémantique des scènes

Bien que l’adaptation de domaine en segmentation sémantique de scènes ait connu des progrès remarquables ces dernières années, les préoccupations liées à l’équité dans ce cadre restent mal définies et insuffisamment traitées. En outre, l’équité constitue l’un des aspects les plus critiques lors du déploiement de modèles de segmentation dans des applications du monde réel impliquant des êtres humains, telles que la conduite autonome, car toute prédiction injuste pourrait avoir des répercussions sur la sécurité humaine. Dans cet article, nous proposons une nouvelle approche, appelée FREDOM (Fairness Domain Adaptation), dédiée à la segmentation sémantique de scènes. Plus précisément, à partir d’un objectif d’équité formulé, nous introduisons un nouveau cadre d’adaptation fondé sur un traitement équitable des distributions de classes. Par ailleurs, afin de modéliser de manière générale le contexte des dépendances structurelles, nous proposons une nouvelle contrainte structurelle conditionnelle visant à assurer la cohérence des prédictions de segmentation. Grâce au réseau structurel conditionnel proposé, le mécanisme d’attention auto-associative a pu efficacement capturer les informations structurelles de la segmentation. Les études d’ablation démontrent que la méthode proposée améliore les performances des modèles de segmentation tout en renforçant l’équité des prédictions. Les résultats expérimentaux sur deux benchmarks standards — SYNTHIA → Cityscapes et GTA5 → Cityscapes — montrent que notre approche atteint des performances de pointe (State-of-the-Art, SOTA).