2달 전

VGGFace2: 자세와 나이를 고려한 얼굴 인식 데이터셋

Qiong Cao; Li Shen; Weidi Xie; Omkar M. Parkhi; Andrew Zisserman
VGGFace2: 자세와 나이를 고려한 얼굴 인식 데이터셋
초록

본 논문에서는 VGGFace2라는 새로운 대규모 얼굴 데이터셋을 소개합니다. 이 데이터셋은 9,131명의 피사체에 대한 331만 장의 이미지를 포함하고 있으며, 각 피사체당 평균 362.6장의 이미지를 제공합니다. 이미지는 구글 이미지 검색에서 다운로드되었으며, 자세, 연령, 조명, 인종 및 직업(예: 배우, 운동선수, 정치인) 등 다양한 특성을 가지고 있습니다. 이 데이터셋은 세 가지 목표를 달성하기 위해 수집되었습니다: (i) 많은 수의 신원과 동시에 각 신원에 대해 많은 수의 이미지를 확보하는 것; (ii) 다양한 자세, 연령 및 인종을 포괄하는 것; 그리고 (iii) 라벨 노이즈를 최소화하는 것입니다. 우리는 이 데이터셋이 수집된 과정을 설명하며, 특히 각 신원의 이미지 정확도를 보장하기 위한 자동 필터링 단계와 수작업 필터링 단계에 대해 설명합니다. 새로운 데이터셋을 사용하여 얼굴 인식 성능을 평가하기 위해, VGGFace2, MS-Celeb-1M 및 두 데이터셋의 합집합에서 ResNet-50(스퀴즈 앤드 익사이테이션(Squeeze-and-Excitation) 블록 포함 여부에 따라) 컨볼루셔널 뉴럴 네트워크(CNN)를 훈련시키고, VGGFace2에서 훈련한 모델이 자세와 연령에 대한 인식 성능이 개선됨을 보여줍니다. 마지막으로, 이러한 데이터셋에서 훈련된 모델들을 사용하여 IARPA Janus 얼굴 인식 벤치마크(IJB-A, IJB-B 및 IJB-C 등)에서 최신 기술(SOTA)보다 크게 우수한 성능을 입증하였습니다. 데이터셋과 모델들은 공개적으로 이용 가능합니다.

VGGFace2: 자세와 나이를 고려한 얼굴 인식 데이터셋 | 최신 연구 논문 | HyperAI초신경