
초록
본 연구는 6자유도(6DoF) 머리 자세 추정의 맥락에서 머리 이동을 추정하는 미묘한 과제를 다루며, 보다 일반적으로 연구되는 머리 회전보다 이 측면에 중점을 둡니다. 기존 방법론에서의 간극을 식별함으로써 우리는 얼굴 기하학과 머리 이동 사이의 활용되지 않은 잠재적 시너지에 주목했습니다. 이러한 간극을 메우기 위해, 우리는 명시적인 양방향 상호작용 구조를 갖춘 새로운 접근 방식인 머리 이동, 회전 및 얼굴 기하학 네트워크(TRG)를 제안합니다. 이 구조는 얼굴 기하학과 머리 이동 사이의 보완 관계를 활용하기 위해 신중하게 설계되었으며, 머리 자세 추정 분야에서 중요한 발전을 이루고 있습니다. 우리의 공헌은 바운딩 박스 수정 매개변수 추정 전략과 랜드마크를 이미지에 맞추는 기술 개발을 포함하며, 이 두 가지 혁신은 6DoF 머리 자세 추정 작업에서 우수한 성능을 보여주고 있습니다. ARKitFace와 BIWI 데이터셋을 사용한 광범위한 실험 결과, 제안된 방법이 현재 최첨단 기술들을 능가한다는 것을 확인하였습니다. 코드는 https://github.com/asw91666/TRG-Release 에서 제공됩니다.