
깊은 이미지 분류기(deep image classifiers)는 데이터셋에서 편향(biases)을 학습하는 것으로 알려져 있습니다. 이러한 편향을 완화하기 위해, 대부분의 이전 방법들은 연령, 피부색과 같은 보호 속성(protected attributes)의 라벨이 필요하며, 이는 두 가지 제한점을 가지고 있습니다: 1) 라벨이 제공되지 않는 경우 적용할 수 없습니다; 2) 인간이 미리 인식하지 못한 편향(unknown biases)을 완화할 수 없습니다. 이러한 문제를 해결하기 위해, 우리는 편향 해제 대체 네트워크(Debiasing Alternate Networks, DebiAN)를 제안합니다. DebiAN은 두 개의 네트워크로 구성되며, 이를 '발견자(Discoverer)'와 '분류기(Classifier)'라고 합니다. 교대 방식으로 훈련함으로써, 발견자는 어떤 편향 주석도 없이 분류기의 여러 가지 알려지지 않은 편향을 찾아내고, 분류기는 발견자가 식별한 편향을 학습에서 제거하는 것을 목표로 합니다. 이전 연구에서는 단일 편향에 대한 완화 결과를 평가하였지만, 우리는 다중 편향 환경에서 여러 가지 편향을 동시에 완화하는 성능을 더 잘 측정할 수 있는 Multi-Color MNIST 데이터셋을 생성하였습니다. 이 데이터셋은 이전 방법들의 문제점을 드러내며, DebiAN의 여러 가지 편향을 동시에 식별하고 완화하는 우위성을 입증합니다. 또한 우리는 실제 데이터셋에서 광범위한 실험을 수행하여, DebiAN의 발견자가 인간이 찾기 어려울 수 있는 알려지지 않은 편향들을 식별할 수 있음을 보여주었습니다. 편향 완화(debiasing) 측면에서 DebiAN은 강력한 성능을 달성하였습니다.