Amélioration de l’échantillonnage mixte multi-domaines avec une formation guidée pour une segmentation adaptative

L’adaptation de domaine non supervisée (UDA) vise à ajuster des modèles entraînés sur un domaine source afin qu’ils performent efficacement sur un domaine cible, sans nécessiter d’étiquetages supplémentaires. Dans le cadre de la segmentation sémantique adaptative au domaine, qui traite l’UDA pour des prédictions denses, l’objectif est de contourner le besoin d’étiquetages coûteux au niveau des pixels. En général, les méthodes courantes s’appuient sur la construction de domaines intermédiaires via des techniques de mélange à travers les domaines, afin de réduire la dégradation des performances due aux écarts entre domaines. Toutefois, de telles approches génèrent des données synthétiques qui s’écartent des distributions réelles du monde réel, pouvant ainsi orienter le modèle loin de la vraie distribution cible. Pour surmonter ce défi, nous proposons une nouvelle tâche auxiliaire appelée Guidance Training. Cette tâche permet une utilisation efficace des techniques de mélange à travers les domaines tout en atténuant les décalages de distribution par rapport au monde réel. Plus précisément, Guidance Training guide le modèle à extraire et à reconstruire la distribution des caractéristiques du domaine cible à partir de données mélangées, puis à décoder ces caractéristiques reconstruites pour produire des prédictions de pseudo-étiquettes. Il est important de noter que l’intégration de Guidance Training entraîne un surcoût d’entraînement négligeable et n’ajoute aucune charge supplémentaire en phase d’inférence. Nous démontrons l’efficacité de notre approche en l’intégrant à des méthodes existantes, observant une amélioration cohérente des performances. L’implémentation sera disponible à l’adresse suivante : https://github.com/Wenlve-Zhou/Guidance-Training.