
초록
나이 추정은 컴퓨터 비전에서 고전적인 학습 문제입니다. AlexNet, VggNet, GoogLeNet, ResNet과 같은 성능이 뛰어난 많은 크고 깊은 CNN들이 제안되었습니다. 그러나 이러한 모델들은 임베디드/모바일 장치에 실용적이지 않습니다. 최근에는 매개변수의 수를 줄여 경량화된 모델을 제공하기 위해 MobileNets와 ShuffleNets가 제안되었습니다. 그러나 깊이별 분리 컨볼루션(depth-wise separable convolution)을 채택함으로써 이들의 표현력이 약해졌습니다. 본 연구에서는 소규모 이미지를 위한 컴팩트 모델의 한계를 조사하고, 매우 컴팩트하면서도 효율적인 캐스케이드 컨텍스트 기반 나이 추정 모델(C3AE)을 제안합니다. 이 모델은 MobileNets/ShuffleNets와 VggNet에 비해 각각 1/9 및 1/2000의 매개변수만을 가지고 있으며, 경쟁력 있는 성능을 달성합니다. 특히, 두 점 표현(two-points representation) 방식으로 나이 추정 문제를 재정의하였으며, 이를 캐스케이드 모델로 구현하였습니다. 또한 얼굴 컨텍스트 정보를 충분히 활용하기 위해 다중 스케일 컨텍스트를 집계하는 다중 브랜치 CNN 네트워크를 제안하였습니다. 세 가지 나이 추정 데이터셋에서 실험을 수행한 결과, 컴팩트 모델에서 최신 기술(state-of-the-art) 성능을 상당한 마진으로 달성하였습니다.