17일 전
라벨 분포의 학습 기대값을 통한 얼굴 연령 및 매력도 추정
Bin-Bin Gao, Xin-Xin Liu, Hong-Yu Zhou, Jianxin Wu, Xin Geng

초록
얼굴 속성(예: 나이 및 매력도) 추정 성능은 합성곱 신경망(Convolutional Neural Networks)의 활용으로 크게 향상되었다. 그러나 기존 방법들은 학습 목표와 평가 지표 사이에 일관성이 부족하여 최적의 성능을 달성하지 못할 수 있다. 또한 이러한 방법들은 일반적으로 파라미터 수가 많은 이미지 분류 또는 얼굴 인식 모델을 사용하기 때문에 계산 비용과 저장 공간 부담이 크다는 문제가 있다. 본 논문에서는 먼저 최신의 두 가지 방법(랭킹-CNN 및 DLDL) 간의 본질적인 관계를 분석하여, 랭킹 기반 방법이 실제로 레이블 분포를 암묵적으로 학습하고 있음을 밝혀냈다. 이 결과를 바탕으로 기존의 두 가지 인기 있는 최첨단 방법을 DLDL 프레임워크 내에서 통합하는 첫 번째 기여를 수행하였다. 두 번째로, 이러한 일관성 문제를 완화하고 자원 소비를 줄이기 위해 경량화된 네트워크 아키텍처를 설계하고, 얼굴 속성 분포를 동시에 학습하고 속성 값을 회귀하는 통합 프레임워크를 제안하였다. 제안한 방법은 얼굴 나이 및 매력도 추정 작업 모두에서 효과성을 입증하였다. 단일 모델 기반으로, 기존의 파라미터 수의 36분의 1에 불과한 36× 적은 파라미터와 3배 빠른 추론 속도를 달성하면서도 새로운 최고 성능을 기록하였다. 또한 파라미터 수를 0.9M(디스크 저장 용량 3.8MB)로 추가로 축소하더라도 최첨단 성능과 비교 가능한 결과를 얻을 수 있음을 보였다.