17일 전
TriHorn-Net: 정확한 깊이 기반 3D 손 자세 추정을 위한 모델
Mohammad Rezaei, Razieh Rastgoo, Vassilis Athitsos

초록
최근 3D 손 자세 추정 기법은 상당한 발전을 이루었으나, 특정 실세계 응용 분야에서는 여전히 추정 정확도가 충분하지 않은 경우가 많아 향상 여지가 크다. 본 논문에서는 깊이 이미지 기반 손 자세 추정 정확도를 향상시키기 위해 특별한 혁신을 도입한 새로운 모델인 TriHorn-Net을 제안한다. 첫 번째 혁신은 3D 손 자세 추정을 깊이 이미지 공간 내 2D 관절 위치 추정(UV 공간)과 해당 관절의 깊이 값 추정으로 분해하는 것이다. 이 과정에서 두 가지 보완적인 어텐션 맵을 활용하여 깊이 추정을 보조한다. 이러한 분해는 깊이 추정이 더 어려운 과제임에도 불구하고, 예측 단계 및 특징 추출 단계에서 UV 추정에 영향을 주는 것을 방지한다. 두 번째 혁신은 PixDropout으로, 우리 연구진의 관점에서 손 깊이 이미지에 적용 가능한 최초의 외형 기반 데이터 증강 기법이다. 실험 결과, 제안된 모델이 세 가지 공개 벤치마크 데이터셋에서 최신 기술을 모두 상회함을 입증하였다. 본 연구의 구현 코드는 https://github.com/mrezaei92/TriHorn-Net 에서 공개되어 있다.