12일 전

다층 LSTM 네트워크를 이용한 스켈레톤 기반 동작 인식을 위한 기하학적 특징

{Jun Xiao, Xiaoming Liu, Songyang Zhang}
다층 LSTM 네트워크를 이용한 스켈레톤 기반 동작 인식을 위한 기하학적 특징
초록

RNN 기반 접근법은 뼈대 입력을 사용한 동작 인식에서 뛰어난 성능을 달성해왔다. 현재 이러한 방법들은 주로 관절의 좌표만을 입력으로 사용하며, 정확도 향상을 위해 다양한 방식으로 RNN 모델을 공간 영역으로 확장하는 데 집중하고 있다. 이러한 모델들은 관절 좌표로부터 서로 다른 부분 간의 관계를 직접 탐색하지만, 우리는 RNN 모델 강화와는 수직적인 방향으로, 간단하면서도 보편적인 공간 모델링 방법을 제안한다. 구체적으로, 이전 연구의 발전 과정을 바탕으로 간단한 기하학적 특징들을 선정한다. 3층 LSTM 프레임워크에서의 실험을 통해, 관절과 특정 선 사이의 거리 기반 기하학적 관계 특징이 다른 특징들보다 우수한 성능을 보이며, 네 가지 데이터셋에서 최신 기준(SOTA) 성과를 달성함을 확인하였다. 또한, 기하학적 특징에 의해 학습된 첫 번째 LSTM 층에서 입력 게이트 가중치의 희소성을 관찰하고, 관절-선 거리를 입력으로 사용할 경우 학습에 필요한 데이터 양이 적다는 것을 입증하였다.

다층 LSTM 네트워크를 이용한 스켈레톤 기반 동작 인식을 위한 기하학적 특징 | 최신 연구 논문 | HyperAI초신경