Traduction d'Images Multi-composantes pour une Généralisation Profonde des Domaines

L'adaptation de domaine (DA) et la généralisation de domaine (DG) sont deux méthodes étroitement liées qui visent toutes deux à attribuer des étiquettes à un ensemble de données non étiquetées. La seule différence entre ces approches réside dans le fait que DA peut accéder aux données cibles pendant la phase d'entraînement, tandis que les données cibles sont totalement inconnues pendant cette même phase dans le cas de DG. La tâche de DG est particulièrement ardue car nous n'avons aucune connaissance préalable des échantillons cibles. Si les méthodes DA sont appliquées directement à DG en excluant simplement les données cibles de l'entraînement, cela entraînera une mauvaise performance pour une tâche donnée.Dans cet article, nous abordons le défi de la généralisation de domaine par deux approches distinctes. Dans notre première approche, nous proposons une nouvelle architecture de généralisation de domaine profonde utilisant des données synthétiques générées par un réseau génératif adversarial (GAN). L'écart entre les images générées et les images synthétiques est minimisé en utilisant des métriques existantes d'écart inter-domaines, telles que la divergence moyenne maximale ou l'alignement de corrélation. Dans notre seconde approche, nous introduisons un protocole pour appliquer les méthodes DA à un scénario DG en excluant les données cibles de la phase d'entraînement, en divisant les données sources en parties d'entraînement et de validation, et en traitant les données de validation comme des données cibles pour DA.Nous menons des expériences exhaustives sur quatre jeux de données基准数据集 (benchmark datasets) inter-domaines. Les résultats expérimentaux indiquent que notre modèle proposé surpasse les méthodes actuelles les plus avancées pour DG.(Note: "基准数据集" is a term that might not be commonly used in French academic writing; I've provided the English term in parentheses to ensure clarity.)