17일 전

HandFoldingNet: 2D 손 뼈대의 다중 스케일 특징 유도 접기 기반 3D 손 자세 추정 네트워크

Wencan Cheng, Jae Hyun Park, Jong Hwan Ko
HandFoldingNet: 2D 손 뼈대의 다중 스케일 특징 유도 접기 기반 3D 손 자세 추정 네트워크
초록

다양한 인간-컴퓨터 상호작용 응용 분야에서 3차원 손 자세 추정 기술의 활용이 증가함에 따라, 컨볼루션 신경망(CNN) 기반의 추정 모델이 적극적으로 연구되고 있다. 그러나 기존 모델들은 적절한 정확도를 확보하기 위해 복잡한 아키텍처나 부담스러운 계산 자원을 요구하는 경향이 있다. 이러한 한계를 극복하기 위해 본 논문에서는 정규화된 3차원 손 포인트 클라우드 입력으로부터 손 관절 위치를 회귀하는 정확하고 효율적인 손 자세 추정기인 HandFoldingNet을 제안한다. 제안된 모델은 주어진 2차원 손 뼈대를 해당 관절 좌표로 접는(folding) 기반의 디코더를 활용한다. 더 높은 추정 정확도를 위해 접는 과정은 전역 특징과 각 관절별 국소 특징을 포함하는 다중 스케일 특징에 의해 안내된다. 실험 결과, 제안된 모델은 세 가지 손 자세 벤치마크 데이터셋에서 기존 방법들을 모두 상회하며, 가장 낮은 모델 파라미터 요구량을 보였다. 코드는 https://github.com/cwc1260/HandFold 에서 공개되어 있다.

HandFoldingNet: 2D 손 뼈대의 다중 스케일 특징 유도 접기 기반 3D 손 자세 추정 네트워크 | 최신 연구 논문 | HyperAI초신경