BiaSwap : Élimination du biais des jeux de données par l'augmentation d'échange adaptée au biais

Les réseaux neuronaux profonds prennent souvent des décisions fondées sur les corrélations spurieuses inhérentes au jeu de données, échouant à généraliser dans une distribution de données non biaisée. Bien que les approches précédentes prédéfinissent le type de biais du jeu de données pour éviter que le réseau l'apprenne, identifier le type de biais dans un jeu de données réel est souvent prohibitif. Cet article propose une nouvelle approche basée sur l'augmentation et adaptée au biais, appelée BiaSwap, pour apprendre des représentations débiaisées sans nécessiter une supervision sur le type de biais. En supposant que le biais correspond aux attributs faciles à apprendre, nous classons les images d'entraînement en fonction du degré d'exploitation par un classifieur biaisé de ces attributs comme raccourcis et les divisons en échantillons guidés par le biais et en échantillons contraires au biais de manière non supervisée. Par la suite, nous intégrons le module de transfert stylistique du modèle de traduction d'image avec les cartes d'activation de classe du classifieur biaisé, ce qui permet principalement de transférer les attributs de biais appris par le classifieur. Ainsi, étant donné un couple d'échantillons guidés par le biais et d'échantillons contraires au biais, BiaSwap génère une image avec un échange de biais qui contient les attributs de biais provenant des images contraires au biais tout en préservant les attributs non liés au biais dans les images guidées par le biais. Avec ces images augmentées, BiaSwap montre sa supériorité en matière de débiaisage par rapport aux méthodes existantes sur des jeux de données synthétiques et réels. Même sans une supervision attentive du biais, BiaSwap obtient des performances remarquables tant sur les échantillons non guidés par le biais que sur ceux guidés par celui-ci, suggérant une capacité généralisatrice améliorée du modèle.