ASMNet: 얼굴 정렬 및 자세 추정을 위한 경량 심층 신경망

Active Shape Model(ASM)은 대상 구조를 표현하는 객체 형태의 통계 모델이다. ASM은 머신러닝 알고리즘을 도와, 이미지 상에 객체(예: 얼굴)를 나타내는 점들의 집합을 적합시키는 데 기여할 수 있다. 본 논문에서는 야외 환경에서 얼굴 정렬과 머리 자세 추정을 위한 가벼운 컨볼루셔널 신경망(CNN) 아키텍처를 제안하며, 이 모델의 손실 함수는 ASM에 의해 보조된다. 우리는 먼저 ASM을 사용하여 네트워크가 얼굴 랜드마크 점들의 더 매끄러운 분포를 학습하도록 안내한다. 전이 학습(transfer learning)의 아이디어를 영감으로 삼아, 학습 과정 중에 회귀 문제를 점차 더 강화하고, 네트워크가 원래의 랜드마크 점 분포를 학습하도록 유도한다. 손실 함수 내에서 얼굴 랜드마크 점 탐지와 얼굴 자세 추정을 담당하는 다중 작업(multi-tasks)을 정의하였다. 서로 관련된 다수의 작업을 동시에 학습함으로써 상호 보완적 효과가 발생하고, 각 작업의 성능이 향상된다. 제안하는 모델인 ASMNet의 성능을 ASMNet보다 약 2배 큰 MobileNetV2와 비교하였다. 도전적인 데이터셋에서의 실험 결과, 제안된 ASM 기반 손실 함수를 사용함으로써 ASMNet은 얼굴 정렬 작업에서 MobileNetV2와 유사한 성능을 달성하였다. 또한 얼굴 자세 추정 작업에서는 ASMNet이 MobileNetV2보다 훨씬 우수한 성능을 보였다. ASMNet은 많은 CNN 기반 모델들에 비해 파라미터 수와 부동소수점 연산 수가 크게 적지만, 얼굴 랜드마크 점 탐지 및 자세 추정에서 만족스러운 성능을 달성하였다.