HyperAIHyperAI
vor 17 Tagen

Null-Sampling für interpretierbare und faire Darstellungen

Thomas Kehrenberg, Myles Bartlett, Oliver Thomas, Novi Quadrianto
Null-Sampling für interpretierbare und faire Darstellungen
Abstract

Wir schlagen vor, invarianzorientierte Darstellungen im Datendomäne zu lernen, um Interpretierbarkeit in der algorithmischen Fairness zu erreichen. Invarianz impliziert eine Selektivität gegenüber hochwertigen, relevanten Korrelationen im Hinblick auf die Klassenlabel-Beschriftungen sowie eine Robustheit gegenüber irrelevanten Korrelationen mit geschützten Merkmalen wie Rasse oder Geschlecht. Wir stellen eine nicht-triviale Situation vor, bei der der Trainingsdatensatz eine starke Bias aufweist, sodass die Klassenlabel-Beschriftungen irrelevant sind und spurious Korrelationen nicht unterscheidbar sind. Um dieses Problem anzugehen, führen wir ein adversarisch trainiertes Modell mit einer Null-Sampling-Prozedur ein, um invarianzorientierte Darstellungen im Datendomäne zu erzeugen. Zur Förderung der Entkoppelung wird eine teilweise beschriftete repräsentative Menge verwendet. Durch die Platzierung der Darstellungen im Datendomäne sind die Veränderungen, die vom Modell vorgenommen werden, leicht durch menschliche Audits überprüfbar. Wir zeigen die Wirksamkeit unserer Methode an beiden Bild- und tabellarischen Datensätzen: Colored MNIST, CelebA und der Adult-Datenbank.

Null-Sampling für interpretierbare und faire Darstellungen | Neueste Forschungsarbeiten | HyperAI