Découvrir et atténuer les biais inconnus avec des réseaux alternatifs de débiaisage

Les classifieurs d'images profonds ont été constatés apprendre des biais à partir de jeux de données. Pour atténuer ces biais, la plupart des méthodes précédentes nécessitent des étiquettes d'attributs protégés (par exemple, âge, teinte de peau) en supervision complète, ce qui présente deux limitations : 1) c'est impossible lorsque les étiquettes ne sont pas disponibles ; 2) elles ne sont pas capables d'atténuer les biais inconnus -- des biais que les humains n'anticipent pas. Afin de résoudre ces problèmes, nous proposons les Réseaux Alternatifs pour le Débiaisage (DebiAN), composés de deux réseaux -- un Découvreur et un Classifieur. En s'entraînant de manière alternée, le découvreur tente de trouver plusieurs biais inconnus du classifieur sans aucune annotation de biais, tandis que le classifieur vise à désapprendre les biais identifiés par le découvreur. Alors que les travaux antérieurs évaluent les résultats du débiaisage en termes d'un seul biais, nous créons le jeu de données Multi-Color MNIST pour mieux évaluer l'atténuation de plusieurs biais dans un contexte multi-biais, ce qui non seulement met en lumière les problèmes des méthodes précédentes mais aussi démontre l'avantage de DebiAN dans l'identification et l'atténuation simultanées de plusieurs biais. Nous menons également des expériences approfondies sur des jeux de données réels, montrant que le découvreur dans DebiAN peut identifier des biais inconnus qui peuvent être difficiles à détecter pour les humains. En ce qui concerne l'atténuation des biais, DebiAN obtient une performance robuste en matière de débiaisage.