ProCST : Amélioration de la segmentation sémantique par transfert de style cyclique progressif

L'utilisation de données synthétiques pour l'entraînement des réseaux de neurones qui obtiennent de bonnes performances sur des données du monde réel est une tâche importante car elle peut réduire le besoin d'une annotation de données coûteuse. Cependant, les données synthétiques et réelles présentent un écart de domaine. La réduction de cet écart, également connue sous le nom d'adaptation de domaine, a été largement étudiée ces dernières années. Fermer l'écart de domaine entre les données sources (synthétiques) et cibles (réelles) en effectuant directement l'adaptation entre les deux est un défi. Dans ce travail, nous proposons un cadre novateur en deux étapes pour améliorer les techniques d'adaptation de domaine sur des données d'images. Dans la première étape, nous entraînons progressivement un réseau neuronal multi-échelle pour effectuer la traduction d'image du domaine source au domaine cible. Nous désignons les nouvelles données transformées comme "Source dans la Cible" (SiT). Ensuite, nous intégrons les données SiT générées en tant qu'entrée dans toute approche UDA standard. Ces nouvelles données présentent un écart de domaine réduit par rapport au domaine cible souhaité, facilitant ainsi l'approche UDA appliquée pour fermer davantage l'écart. Nous soulignons l'efficacité de notre méthode par une comparaison avec d'autres techniques UDA et de traduction d'image à image lorsqu'elles sont utilisées comme générateurs SiT. De plus, nous démontrons l'amélioration apportée par notre cadre avec trois méthodes UDA de pointe pour la segmentation sémantique : HRDA, DAFormer et ProDA, sur deux tâches UDA : GTA5 vers Cityscapes et Synthia vers Cityscapes.