2달 전

HDNet: 다중 인물 카메라 공간 위치 추정을 위한 인간 깊이 추정

Lin, Jiahao ; Lee, Gim Hee
HDNet: 다중 인물 카메라 공간 위치 추정을 위한 인간 깊이 추정
초록

현재 다중 인물 3D 자세 추정 연구는 주로 루트 관절을 기준으로 한 3D 관절 위치의 추정에 초점을 맞추고 있으며 각 자세의 절대 위치는 무시하고 있습니다. 본 논문에서는 카메라 좌표 공간에서 절대 루트 관절 위치를 추정하기 위한 엔드투엔드 프레임워크인 인간 깊이 추정 네트워크(Human Depth Estimation Network, HDNet)를 제안합니다. 제안된 HDNet은 먼저 관절의 히트맵을 사용하여 2D 인간 자세를 추정합니다. 이러한 추정된 히트맵은 대상 사람에 해당하는 이미지 영역에서 특징을 풀링하는 데 필요한 주의 마스크(attention mask) 역할을 합니다. 또한, 골격 기반 그래프 신경망(Graph Neural Network, GNN)을 활용하여 관절 간 특징 전파를 수행합니다. 우리는 목표 깊이 회귀 문제를 클래스 분류 출력에서 소프트-아르그맥스(soft-argmax) 연산을 통해 변환 가능한 바구니 인덱스(bin index) 추정 문제로 정식화하였습니다. Human3.6M과 MuPoTS-3D 두 벤치마크 데이터셋을 사용하여 루트 관절 위치 추정 및 루트 상대 3D 자세 추정 작업에서 HDNet의 성능을 평가하였습니다. 실험 결과는 여러 평가 지표 하에서 일관되게 이전 최신 기술(state-of-the-art)보다 우수한 성능을 보였음을 확인하였습니다. 우리의 소스 코드는 다음 링크에서 이용 가능합니다: https://github.com/jiahaoLjh/HumanDepth.

HDNet: 다중 인물 카메라 공간 위치 추정을 위한 인간 깊이 추정 | 최신 연구 논문 | HyperAI초신경