HyperAIHyperAI
il y a 2 mois

Apprendre à diversifier pour la généralisation mono-domaine

Zijian Wang; Yadan Luo; Ruihong Qiu; Zi Huang; Mahsa Baktashmotlagh
Apprendre à diversifier pour la généralisation mono-domaine
Résumé

La généralisation de domaine (DG) vise à généraliser un modèle formé sur plusieurs domaines sources (c'est-à-dire d'entraînement) à un domaine cible (c'est-à-dire de test) dont la distribution est différente. Contrairement à la DG conventionnelle qui exige strictement la disponibilité de plusieurs domaines sources, cet article considère un scénario plus réaliste mais plus complexe, appelé Généralisation de Domaine Unique (Single-DG), où seul un domaine source est disponible pour l'entraînement. Dans ce contexte, la diversité limitée peut compromettre la capacité du modèle à se généraliser sur des domaines cibles inconnus. Pour résoudre ce problème, nous proposons un module complémentaire de style visant à améliorer la puissance de généralisation du modèle en synthétisant des images provenant de distributions variées et complémentaires aux sources. Plus précisément, nous utilisons une borne supérieure calculable de l'information mutuelle (MI) entre les échantillons générés et les échantillons sources, et effectuons une optimisation en deux étapes itérativement : (1) en minimisant l'approximation de la borne supérieure de l'information mutuelle pour chaque paire d'échantillons, les images générées sont contraintes d'être diversifiées par rapport aux échantillons sources ; (2) par la suite, nous maximisons l'information mutuelle entre les échantillons appartenant à la même catégorie sémantique, ce qui aide le réseau à apprendre des caractéristiques discriminantes à partir d'images stylées différemment. Des expériences approfondies sur trois jeux de données de référence démontrent la supériorité de notre approche, qui dépasse les méthodes Single-DG les plus avancées actuellement disponibles jusqu'à 25,14 %.

Apprendre à diversifier pour la généralisation mono-domaine | Articles de recherche récents | HyperAI