2달 전
효과적인 얼굴 인식을 위해 정말로 수백만 개의 얼굴을 수집해야 할까요?
Iacopo Masi; Anh Tuan Tran; Jatuporn Toy Leksut; Tal Hassner; Gerard Medioni

초록
최근 얼굴 인식 기술이 획기적인 발전을 이룩하였습니다. 이러한 진보는 적어도 부분적으로 대규모 학습 데이터셋의 증가, 즉 수백만 개의 얼굴 이미지를 다운로드하여 신원을 라벨링한 것에 기인하지만, 이렇게 많은 이미지를 수집하는 어려운 작업이 정말로 필요한지 명확하지 않습니다. 우리는 얼굴 인식 시스템의 학습 데이터셋 크기를 훨씬 쉽게 늘릴 수 있는 방법을 제안합니다. 더 많은 얼굴을 수동으로 수집하고 라벨링하는 대신, 단순히 이를 합성(synthesize)하는 것입니다. 우리는 기존 데이터셋에 중요한 얼굴 표현 변화를 추가하기 위해 포함된 얼굴들을 조작(manipulate)하는 새로운 방법들을 설명합니다. 또한, 표준 컨볼루션 신경망(convolutional neural network)을 사용하여 쿼리 이미지를 표현할 때 이 합성 접근법을 적용하였습니다. 합성 이미지를 이용해 학습과 테스트한 결과는 LFW와 IJB-A(인증 및 식별) 벤치마크와 Janus CS2에서 광범위하게 검증되었습니다. 우리의 접근법으로 얻은 성능은 수백만 개의 다운로드된 이미지를 이용해 학습한 시스템들이 보고한 최신 연구 결과(state of the art results)와 일치합니다.