11일 전

VoxelPose: 야생 환경에서의 다중 카메라 3D 인간 자세 추정으로 향해

Hanyue Tu, Chunyu Wang, Wenjun Zeng
VoxelPose: 야생 환경에서의 다중 카메라 3D 인간 자세 추정으로 향해
초록

다중 카메라 시점에서 다수의 사람에 대한 3차원 자세를 추정하는 방법을 제안한다. 기존의 연구들은 노이즈가 많고 불완전한 2차원 자세 추정 결과를 기반으로 다중 시점 간의 대응 관계를 설정해야 했지만, 본 연구는 2차원 공간에서 잘못된 결정을 내리지 않도록 3차원 공간에서 직접 작동하는 엔드투엔드 솔루션을 제안한다. 이를 위해 모든 카메라 시점의 특징을 공통된 3차원 공간으로 변형하고 집계한 후, 큐보이드 제안 네트워크(Cuboid Proposal Network, CPN)에 입력하여 사람들의 위치를 대략적으로 탐지한다. 이후 각 제안에 대해 상세한 3차원 자세를 추정하기 위해 자세 회귀 네트워크(Pose Regression Network, PRN)를 제안한다. 제안된 방법은 실무에서 흔히 발생하는 가림 현상에도 강건하다. 복잡한 부가 기능 없이도 공개 데이터셋에서 기존 최고 성능 기법들을 능가한다. 코드는 https://github.com/microsoft/multiperson-pose-estimation-pytorch 에서 공개될 예정이다.

VoxelPose: 야생 환경에서의 다중 카메라 3D 인간 자세 추정으로 향해 | 최신 연구 논문 | HyperAI초신경