11일 전

DeepFace: 얼굴 인증에서 인간 수준 성능에 근접하기

{Marc’ Aurelio Ranzato, Ming Yang, Yaniv Taigman, Lior Wolf}
초록

현대의 얼굴 인식에서 전통적인 처리 파이프라인은 감지 → 정렬 → 표현 → 분류의 네 단계로 구성된다. 본 연구에서는 정렬 단계와 표현 단계를 재검토하여, 명시적인 3D 얼굴 모델링을 활용해 조각별 아핀 변환(affine transformation)을 적용하고, 9층의 심층 신경망을 통해 얼굴 표현을 도출한다. 이 심층 네트워크는 표준 합성곱 층 대신 가중치 공유 없이 여러 개의 국소 연결 레이어(local connected layers)를 사용하여 총 1억 2천만 개 이상의 파라미터를 포함하고 있다. 따라서 본 연구에서는 현재까지 가장 큰 얼굴 데이터셋, 즉 4,000개 이상의 개인 정체성을 가진 400만 장의 얼굴 이미지로 구성된 정체성 라벨 데이터셋을 기반으로 모델을 학습시켰다.정확한 모델 기반 정렬과 방대한 얼굴 데이터베이스를 결합한 학습된 표현은 제약 없는 환경에서의 얼굴에 매우 우수한 일반화 성능을 보이며, 단순한 분류기만으로도 뛰어난 성능을 달성한다. 본 방법은 Labeled Faces in the Wild (LFW) 데이터셋에서 97.35%의 정확도를 기록하여, 현재 최고 수준의 기술보다 오류율을 27% 이상 감소시키며 인간 수준의 성능에 근접하였다.

DeepFace: 얼굴 인증에서 인간 수준 성능에 근접하기 | 최신 연구 논문 | HyperAI초신경