Réduction de l'écart de domaine en réduisant le biais de style

Les Réseaux Neuronaux Convolutifs (CNNs) échouent souvent à maintenir leurs performances lorsqu'ils sont confrontés à de nouveaux domaines de test, un problème connu sous le nom de décalage de domaine (domain shift). Des études récentes suggèrent qu'une des principales causes de ce problème est l'induction forte des CNNs vers les styles d'images (c'est-à-dire les textures), qui sont sensibles aux changements de domaine, plutôt que vers les contenus (c'est-à-dire les formes). Inspirés par ces observations, nous proposons de réduire le biais stylistique intrinsèque des CNNs pour combler l'écart entre les domaines. Nos Réseaux Invariants au Style (Style-Agnostic Networks, SagNets) séparent les encodages stylistiques des catégories de classe afin d'éviter des prédictions biaisées par le style et de se concentrer davantage sur les contenus. De nombreuses expériences montrent que notre méthode réduit efficacement le biais stylistique et rend le modèle plus robuste face au décalage de domaine. Elle réalise des améliorations notables des performances dans une large gamme de tâches inter-domaines, y compris la généralisation de domaine, l'adaptation non supervisée de domaine et l'adaptation semi-supervisée de domaine, sur plusieurs ensembles de données.