SER-FIQ: 스토케스틱 임베딩 강건성에 기반한 비지도 얼굴 이미지 품질 추정
얼굴 이미지의 품질은 고성능 얼굴 인식 시스템을 구현하는 데 중요한 요소입니다. 얼굴 품질 평가는 얼굴 이미지가 인식에 적합한지를 추정하는 것을 목표로 합니다. 이전 연구에서는 인공적으로 또는 사람이 부여한 품질 값을 필요로 하는 지도 학습 방안을 제안하였습니다. 그러나 이러한 라벨링 메커니즘은 명확한 품질 정의에 기반하지 않으며, 사용된 얼굴 인식 시스템에 가장 적합한 특성을 알 수 없기 때문에 오류가 발생하기 쉽습니다. 부정확한 품질 라벨의 사용을 피하기 위해, 우리는 임의의 얼굴 인식 모델을 기반으로 한 새로운 개념을 제안하였습니다. 얼굴 모델의 무작위 하위 네트워크에서 생성되는 임베딩 변동성을 결정함으로써 샘플 표현의 견고성과 그에 따른 품질을 추정합니다. 실험은 세 개의 공개 데이터베이스에서 크로스-데이터베이스 평가 설정으로 수행되었습니다. 우리는 두 가지 얼굴 임베딩에 대해 여섯 가지 최신 접근법(학계와 산업계)과 비교를 진행하였습니다. 결과는 제안된 비지도 학습 방안이 대부분 조사된 시나리오에서 모든 다른 접근법보다 우수하다는 것을 보여주었습니다. 이전 연구들과 달리, 제안된 방안은 모든 시나리오에서 안정적인 성능을 보였습니다. 우리의 얼굴 품질 평가 방법론은 배포된 얼굴 인식 모델을 활용하여 완전히 학습 단계를 생략할 수 있으며, 모든 베이스라인 접근법보다 크게 우수한 성능을 발휘하였습니다. 우리의 솔루션은 현재의 얼굴 인식 시스템에 쉽게 통합될 수 있으며, 얼굴 인식 외에도 다른 작업으로 확장될 수 있습니다.