초록
이미지로부터의 머리 자세 추정은 컴퓨터 비전 분야에서 중요한 연구 주제이다. 이 기술은 주의 집중 영역 탐지, 운전자 행동 추적, 인간-컴퓨터 상호작용 등 다양한 응용 분야에 활용된다. 최근 머리 자세 추정 연구는 심층 합성곱 신경망(Convolutional Neural Networks, CNNs) 기반 모델 개발에 집중하고 있다. 이러한 모델들은 전이 학습(transfer learning)과 이미지 증강(image augmentation)을 활용하여 초기화 상태를 개선하고, 가림 현상에 대한 강건성을 향상시키는 데 초점을 맞추고 있다. 그러나 기존의 전이 학습 기반 방법들은 일반적인 이미지 인식을 목표로 하며, 얼굴 인식과 같은 더 작업 지향적인 네트워크로부터의 전이 학습에 대한 심층적 탐구는 부족한 실정이다. 또한 머리 자세 추정의 경우, 심각한 가림, 운동 흐림, 저조도와 같은 노이즈에 대한 강건성은 매우 중요하다. 본 논문에서는 머리 자세 추정 모델의 정확도를 크게 향상시키는 새로운 이미지 증강 기법을 제안한다. 또한 얼굴 인식과 같은 얼굴 관련 작업에 대해 훈련된 모델의 내부 활성화를 분석함으로써, 작업 지향적인 가중치 초기화 방법을 제안하여 추정 정확도를 추가로 개선한다. 제안한 머리 자세 추정 모델은 세 가지 도전적인 테스트 세트에서 평가되었으며, 기존 최고 수준의 방법들에 비해 더 우수한 성능을 달성하였다.