Entdecken und Minderung unbekannter Verzerrungen durch Entverzerrung alternativer Netze

Tiefe Bildklassifizierer wurden darauf hingewiesen, dass sie Verzerrungen aus Datensätzen lernen. Um diese Verzerrungen zu mildern, benötigen die meisten bisherigen Methoden vollständige Überwachung durch Etikettierung geschützter Attribute (z.B. Alter, Hautfarbe). Dies hat zwei Einschränkungen: 1) es ist nicht machbar, wenn die Etiketten nicht verfügbar sind; 2) sie sind unfähig, unbekannte Verzerrungen – Verzerrungen, die Menschen nicht voraussehen können – zu mildern. Um diese Probleme zu lösen, schlagen wir das Debiasing Alternate Networks (DebiAN)-Verfahren vor, das aus zwei Netzwerken besteht – einem Entdecker und einem Klassifizierer. Durch alternierendes Training versucht der Entdecker, mehrere unbekannte Verzerrungen des Klassifizierers ohne jegliche Bias-Etikettierung zu identifizieren, während der Klassifizierer darauf abzielt, die von dem Entdecker identifizierten Verzerrungen wieder zu vergessen. Während frühere Arbeiten die Ergebnisse der Verzerrungsmildigung in Bezug auf eine einzelne Verzerrung bewerteten, haben wir den Multi-Color MNIST-Datensatz erstellt, um die Mildigung mehrerer Verzerrungen in einer multiplen Bias-Umgebung besser abzugleichen. Dies zeigt nicht nur die Probleme bei früheren Methoden auf, sondern demonstriert auch den Vorteil von DebiAN bei der gleichzeitigen Identifikation und Mildigung mehrerer Verzerrungen. Wir führen zudem umfangreiche Experimente mit realen Datensätzen durch und zeigen, dass der Entdecker in DebiAN unbekannte Verzerrungen identifizieren kann, die für Menschen schwer zu erkennen sein könnten. Was die Mildigung von Verzerrungen betrifft, erzielt DebiAN starke Leistungsresultate.