Généraliser puis adapter : segmentation sémantique par adaptation de domaine sans source

L’adaptation de domaine non supervisée (DA) a suscité un intérêt croissant dans le domaine du découpage sémantique. Toutefois, presque toutes les approches antérieures supposent un accès simultané aux données étiquetées de la source et aux données non étiquetées de la cible, ce qui les rend inadaptées aux scénarios nécessitant une adaptation sans accès à la source. Dans ce travail, nous proposons une méthode d’adaptation sans source en décomposant la tâche en deux composantes : a) une généralisation de domaine uniquement à partir de la source, et b) une adaptation cible sans source. Concernant la première composante, nous apportons des insights théoriques permettant de concevoir un cadre à plusieurs têtes entraîné sur un ensemble de données multi-sources virtuellement étendu, visant à équilibrer la généralisation et la spécificité. Pour la seconde composante, nous exploitons ce cadre à plusieurs têtes afin d’extraire des pseudo-étiquettes fiables pour la cible, utilisées dans un processus de self-training. Par ailleurs, nous introduisons un nouvel auto-encodeur imposant une priorité conditionnelle, qui réduit les irrégularités spatiales, améliorant ainsi la qualité des pseudo-étiquettes. Des expériences menées sur les benchmarks standards GTA5 → Cityscapes et SYNTHIA → Cityscapes démontrent l’efficacité de notre méthode, surpassant même certaines approches non sans source. En outre, nous montrons la compatibilité de notre méthode avec l’adaptation en ligne, ouvrant la voie à son déploiement dans des environnements évoluant de manière séquentielle.