광범위하고 짧은 범위의 머리 자세 추정에 대한 표현 및 방법론

머리 자세 추정(Head Pose Estimation, HPE)은 컴퓨터 비전 분야에서 반측면 또는 측면 환경에서 얼굴 처리 작업의 성능을 향상시키기 위한 관심사입니다. 최근 응용 프로그램에서는 얼굴을 360도 회전 범위 내에서 분석하는 것이 필요합니다. 전통적인 방법들은 반측면과 측면 경우를 해결하기에는 적합하지만, 전체 회전 범위에 대해서는 직접적으로 적용할 수 없습니다. 본 논문에서는 짧은 범위와 넓은 범위의 HPE에 대한 방법론을 분석하고 각각의 경우에 적합한 표현 방식과 지표를 논의합니다. 우리는 인기 있는 오일러 각(Euler angles) 표현이 짧은 범위의 HPE에는 좋은 선택이지만 극단적인 회전에서는 그렇지 않다는 것을 보여줍니다. 그러나 오일러 각의 기판 잠금(gimbal lock) 문제로 인해 이 표현 방식은 어떤 환경에서도 유효한 지표로 사용될 수 없습니다. 또한 현재의 크로스 데이터셋 평가 방법론을 재검토하고, 학습 데이터셋과 테스트 데이터셋 간의 참조 시스템 불일치가 문헌에서 모든 연구 결과를 부정적으로 편향시킨다는 점을 지적합니다. 우리는 이러한 불일치를 정량화하는 절차와 300W-LP|Biwi 벤치마크에 대해 새로운, 더 정확한 최신 기술(SOTA)을 설정하는 크로스 데이터셋 HPE를 위한 새로운 방법론을 제안합니다. 또한, 모델 최적화 과정에서 각 학습 샘플의 기여도를 조절할 수 있는 손실 함수(loss function) 구축을 가능하게 하는 지오데식 각 거리(geodesic angular distance) 지표의 일반화를 제안합니다. 마지막으로, CMU 파노프틱(CMU Panoptic) 데이터셋을 기반으로 한 넓은 범위 HPE 벤치마크를 소개합니다.