17일 전

3D 인간 자세 추정을 위한 네트워크 구조 최적화

{ Yizhou Wang, Xiaoxuan Ma, Chunyu Wang, Hai Ci}
3D 인간 자세 추정을 위한 네트워크 구조 최적화
초록

인간의 자세는 관절을 노드로, 뼈를 엣지로 하는 그래프로 자연스럽게 표현될 수 있다. 따라서 2D 자세에서 3D 자세를 추정하는 데 Graph Convolutional Network(GCN)을 적용하는 것은 자연스러운 접근이다. 본 연구에서는 GCN과 Fully Connected Network(FCN) 모두가 특수한 경우에 해당하는 일반화된 수식을 제안한다. 이 일반화된 수식을 통해 GCN이 3D 자세 추정에 사용될 때 제한된 표현 능력을 가짐을 발견하였다. 이러한 한계를 극복하기 위해, 본 일반화된 수식을 자연스럽게 구현할 수 있는 Locally Connected Network(LCN)을 도입하였으며, 이는 GCN에 비해 상당히 뛰어난 표현 능력을 제공한다. 또한, 각 관절이 자신의 주변 관절 몇 개와만 연결되어 있기 때문에, 매우 뛰어난 일반화 능력을 갖는다. 공개 데이터셋을 이용한 실험 결과는 다음과 같은 성과를 보여준다: (1) 기존 최고 수준의 모델들을 초월한다; (2) 대안 모델들에 비해 더 적은 데이터에 의존한다; (3) 미리 보지 못한 동작과 데이터셋에 대해서도 잘 일반화된다.

3D 인간 자세 추정을 위한 네트워크 구조 최적화 | 최신 연구 논문 | HyperAI초신경