
초록
본 논문에서는 제약 없는 엔드투엔드 헤드 포즈 추정을 위한 방법을 제안한다. 기존의 회전 레이블의 모호성 문제를 해결하기 위해, 정답 데이터에 회전 행렬 형식을 도입하고, 효율적이고 견고한 직접 회귀를 위한 연속적인 6차원 회전 행렬 표현을 제안한다. 이를 통해 본 방법은 기존의 좁은 각도 범위 내에서만 포즈 예측을 제한하는 기존 방법들과 달리, 전체 회전 특성을 학습할 수 있다. 또한, SO(3) 다양체 기하학에 기반한 지오데식 거리 기반 손실 함수를 제안하여 네트워크의 훈련을 SO(3) 다양체의 기하 구조에 맞게 정규화한다. 공개된 AFLW2000 및 BIWI 데이터셋을 이용한 실험 결과, 제안한 방법이 기존 최첨단 기법들에 비해 최대 20%까지 우수한 성능을 보였다. 본 연구의 훈련 및 테스트 코드와 사전 학습된 모델은 오픈소스로 제공되며, 아래 링크에서 확인할 수 있다: https://github.com/thohemp/6DRepNet.