
要約
深層画像分類器はデータセットからバイアスを学習することが明らかになっています。これらのバイアスを軽減するために、これまでの多くの手法では保護属性(例:年齢、肌色)のラベルを完全監督として必要としますが、これには2つの制限があります。1) ラベルが利用できない場合、その手法は実現不可能です;2) 人類が予想していない未知のバイアスを軽減することはできません。これらの問題を解決するため、私たちは「Debiasing Alternate Networks(DebiAN)」という手法を提案します。この手法は2つのネットワーク、すなわちディスカバラーとクラシファイアから構成されています。交互に訓練することで、ディスカバラーはクラシファイアの複数の未知のバイアスを見つけることを試みます。これはバイアスの注釈なしで行われます。一方、クラシファイアはディスカバラーによって特定されたバイアスを学習しないように努力します。従来の研究では単一のバイアスについてのみデバイアシング結果が評価されてきましたが、私たちは多様なバイアス設定において複数のバイアス軽減をより適切にベンチマークするため、「Multi-Color MNIST」データセットを作成しました。このデータセットは、従来手法における問題点を明らかにするだけでなく、DebiANが同時に複数のバイアスを見つけて軽減する優位性も示しています。さらに、私たちは実世界のデータセットを使用して広範な実験を行いました。その結果、DebiAN内のディスカバラーが人間にとって見つけにくい未知のバイアスを見つけることができることが示されました。デバイアシングに関して言えば、DebiANは強力なバイアス軽減性能を達成しています。