2달 전
FairFace: 균형 잡힌 인종, 성별, 나이를 위한 얼굴 속성 데이터셋
Kärkkäinen, Kimmo ; Joo, Jungseock

초록
기존의 공개 얼굴 데이터셋은 백인 얼굴에 강하게 편향되어 있으며, 다른 인종(예: 라티노)은 크게 부족한 상태입니다. 이는 모델의 정확도가 일관되지 않게 되어 비백인 인종 그룹에 대한 얼굴 분석 시스템의 적용 범위를 제한하고, 이러한 왜곡된 데이터를 기반으로 한 연구 결과에 부정적인 영향을 미칠 수 있습니다. 이러한 데이터셋에서의 인종 편향을 완화하기 위해, 우리는 108,501장의 이미지를 포함하는 새로운 얼굴 이미지 데이터셋을 구축하였습니다. 이 데이터셋은 균형 잡힌 인종 구성에 중점을 두고 있으며, 7개의 인종 그룹(백인, 흑인, 인도인, 동아시아인, 동남아시아인, 중동인, 라티노)을 정의하였습니다. 이미지는 YFCC-100M Flickr 데이터셋에서 수집되었으며, 인종, 성별 및 연령 그룹으로 라벨링되었습니다. 평가는 기존 얼굴 속성 데이터셋뿐만 아니라 새로운 이미지 데이터셋에서도 수행되어 일반화 성능을 측정하였습니다. 우리는 우리 데이터셋으로 학습된 모델이 새로운 데이터셋에서 현저히 더 정확하며, 인종과 성별 그룹 간의 정확도가 일관됨을 확인하였습니다.