2달 전
Region Ensemble Network: 손 포즈 추정을 위한 합성곱 신경망 개선
Hengkai Guo; Guijin Wang; Xinghao Chen; Cairong Zhang; Fei Qiao; Huazhong Yang

초록
단일 시점 깊이 이미지에서 손 포즈 추정은 인간-컴퓨터 상호작용에 있어 중요한 과제이자 어려운 문제입니다. 최근에는 이 문제를 해결하기 위해 복잡한 설계를 가진 딥 컨볼루션 네트워크(ConvNet)가 사용되고 있지만, 전통적인 방법들에 비해 개선된 점이 명확하지 않습니다. 직접적인 3D 좌표 회귀의 성능을 향상시키기 위해, 우리는 나무 구조의 지역 앙상블 네트워크(Region Ensemble Network, REN)를 제안합니다. 이 모델은 컨볼루션 출력을 여러 지역으로 분할하고 각 지역에서 여러 회귀기의 결과를 통합합니다. 다중 모델 앙상블과 비교하여 우리의 모델은 완전히 엔드투엔드(end-to-end)로 학습됩니다. 실험 결과는 우리의 접근법이 두 공개 데이터셋에서 최고의 성능을 보임을 입증하였습니다.