13일 전

WebFace260M: 백만 규모의 심층 얼굴 인식 성능을 드러내는 벤치마크

Zheng Zhu, Guan Huang, Jiankang Deng, Yun Ye, Junjie Huang, Xinze Chen, Jiagang Zhu, Tian Yang, Jiwen Lu, Dalong Du, Jie Zhou
WebFace260M: 백만 규모의 심층 얼굴 인식 성능을 드러내는 벤치마크
초록

본 논문에서는 노이즈가 포함된 400만 명의 개인 정보/2억 6천만 장의 얼굴 이미지(이하 WebFace260M)와 정제된 200만 명의 개인 정보/4,200만 장의 얼굴 이미지(이하 WebFace42M)를 포함하는 새로운 백만 규모 얼굴 인식 기준 데이터셋을 제안하며, 시간 제약 조건을 고려한 정교하게 설계된 평가 프로토콜도 함께 제시한다. 먼저, 인터넷에서 400만 명의 이름 목록을 수집하고, 이를 기반으로 2억 6천만 장의 얼굴 이미지를 다운로드하였다. 이후, 자가 학습(Self-Training)을 활용한 자동 정제(Cleaning Automatically utilizing Self-Training, CAST) 파이프라인을 개발하여 방대한 WebFace260M 데이터셋을 효율적이고 확장 가능한 방식으로 정제하였다. 알려진 바에 따르면, 정제된 WebFace42M는 현재까지 공개된 가장 큰 얼굴 인식 학습 데이터셋이며, 학계와 산업계 간의 데이터 격차를 해소할 것으로 기대된다. 실용적 시나리오를 반영하여, 추론 시간 제약 하에서의 얼굴 인식(Face Recognition Under Inference Time conStraint, FRUITS) 프로토콜과 해당 평가용 테스트 세트를 구축하여 얼굴 매칭 모델의 종합적인 성능을 평가하였다.이러한 기준 데이터셋을 바탕으로, 백만 규모 얼굴 인식 문제에 대해 심층적인 탐구를 수행하였다. 성능 저하 없이 효율적인 모델 학습을 가능하게 하기 위해 분산형 프레임워크를 개발하였으며, WebFace42M를 기반으로 도전적인 IJB-C 데이터셋에서 상대적 오류율을 40% 감소시켰고, NIST-FRVT에서 430개 참가 엔트리 중 3위를 기록하였다. 또한, 전체 데이터의 10%만 사용한 WebFace4M도 공개된 학습 데이터셋보다 뛰어난 성능을 보였다. 더불어, FRUITS-100ms/500ms/1000ms 프로토콜 하에서 풍부한 속성 정보를 갖춘 테스트 세트를 기반으로 다양한 기준 모델들을 구축하였으며, MobileNet, EfficientNet, AttentionNet, ResNet, SENet, ResNeXt, RegNet 등의 주요 네트워크 아키텍처를 포함하였다. 기준 데이터셋 웹사이트는 https://www.face-benchmark.org 이다.

WebFace260M: 백만 규모의 심층 얼굴 인식 성능을 드러내는 벤치마크 | 최신 연구 논문 | HyperAI초신경