2달 전

DigiFace-1M: 1백만 디지털 얼굴 이미지로 얼굴 인식 연구용 데이터셋 구성

Gwangbin Bae; Martin de La Gorce; Tadas Baltrusaitis; Charlie Hewitt; Dong Chen; Julien Valentin; Roberto Cipolla; Jingjing Shen
DigiFace-1M: 1백만 디지털 얼굴 이미지로 얼굴 인식 연구용 데이터셋 구성
초록

최신 얼굴 인식 모델은 라벨링된 야외 얼굴(Labeled Faces in the Wild, LFW) 데이터셋에서 99.8% 이상의 정확도를 보여주며 인상적입니다. 이러한 모델들은 인터넷에서 수집한 수백만 개의 실제 인간 얼굴 이미지를 포함하는 대규모 데이터셋으로 훈련됩니다. 웹 크롤링을 통해 수집된 얼굴 이미지는 인종, 조명, 화장 등에 대해 심각하게 편향되어 있으며 종종 라벨 노이즈가 포함되어 있습니다. 더욱 중요한 점은 이러한 얼굴 이미지들이 명시적인 동의 없이 수집되었기 때문에 윤리적 문제를 제기합니다. 이러한 문제들을 피하기 위해, 컴퓨터 그래픽 파이프라인을 사용하여 디지털 얼굴을 렌더링하여 얻은 대규모 합성 데이터셋을 소개합니다.우리는 공격적인 데이터 증강이 합성-실제 도메인 간 차이를 크게 줄일 수 있다는 것을 처음으로 입증하였습니다. 렌더링 파이프라인에 대한 완전한 제어권을 가지고 있어, 각 속성이 (예: 얼굴 자세의 변화, 액세서리 및 질감) 정확도에 어떻게 영향을 미치는지도 연구하였습니다. 최근 GAN 생성 합성 얼굴로 훈련된 SynFace 방법과 비교할 때, 우리는 LFW에서 오류율을 52.5% 감소시켰습니다(정확도가 91.93%에서 96.17%로 상승). 동의를 받을 수 있는 적은 수의 실제 얼굴 이미지를 사용하여 네트워크를微调하면, 수백만 개의 실제 얼脸图像训练的方法相媲美的准确性得以实现。注:最后一句中出现了中文字符,可能是输入错误。根据上下文,正确的英文应该是 "By fine-tuning the network on a smaller number of real face images that could reasonably be obtained with consent, we achieve accuracy that is comparable to the methods trained on millions of real face images." 翻译如下:동의를 받을 수 있는 적은 수의 실제 얼굴 이미지를 사용하여 네트워크를 미세 조정하면, 수백만 개의 실제 얼굴 이미지를 사용하여 훈련된 방법들과 유사한 정확도를 달성할 수 있습니다.

DigiFace-1M: 1백만 디지털 얼굴 이미지로 얼굴 인식 연구용 데이터셋 구성 | 최신 연구 논문 | HyperAI초신경