DecAug : Généralisation hors distribution par représentation de caractéristiques décomposée et augmentation sémantique

Bien que l’apprentissage profond démontre une forte capacité à traiter des données indépendantes et identiquement distribuées (IID), il souffre fréquemment d’un problème de généralisation hors distribution (OoD), lorsque les données de test proviennent d’une distribution différente de celle des données d’entraînement. Concevoir un cadre général de généralisation OoD applicable à une large gamme d’applications s’avère difficile, principalement en raison des décalages de corrélation et des décalages de diversité présents dans le monde réel. La plupart des approches antérieures ne parviennent à résoudre qu’un seul type de décalage de distribution, par exemple un décalage entre domaines ou une extrapolation de corrélation. Pour surmonter cette limitation, nous proposons DecAug, une nouvelle approche fondée sur une représentation décomposée des caractéristiques et une augmentation sémantique pour la généralisation OoD. DecAug sépare les caractéristiques liées à la catégorie de celles liées au contexte. Les caractéristiques liées à la catégorie contiennent des informations causales relatives à l’objet cible, tandis que les caractéristiques liées au contexte décrivent des attributs, des styles, des arrière-plans ou des scènes susceptibles de provoquer des décalages de distribution entre les données d’entraînement et celles de test. Cette décomposition est réalisée en orthogonalisant les deux gradients (par rapport aux caractéristiques intermédiaires) des pertes associées à la prédiction des étiquettes de catégorie et de contexte. Par ailleurs, nous appliquons une augmentation basée sur les gradients aux caractéristiques liées au contexte afin d’améliorer la robustesse des représentations apprises. Les résultats expérimentaux montrent que DecAug surpasser d’autres méthodes de pointe sur divers jeux de données OoD, se positionnant parmi les rares approches capables de traiter efficacement différents types de défis liés à la généralisation OoD.