16일 전

3D 스켈레톤을 리 군 내 점으로 표현함을 통한 인간 행동 인식

{Felipe Arrate, Rama Chellappa, Raviteja Vemulapalli}
초록

최근에 소개된 저비용의 깊이 센서와 Shotton 등이 제안한 실시간 스켈레톤 추정 알고리즘이 결합되면서, 스켈레톤 기반의 인간 행동 인식에 대한 관심이 다시 고조되고 있다. 기존의 대부분의 스켈레톤 기반 접근법은 인간의 스켈레톤을 표현하기 위해 관절 위치 또는 관절 각도 중 하나를 사용한다. 본 논문에서는 3차원 공간 내에서 회전과 평행 이동을 이용하여 신체 부위 간의 3차원 기하학적 관계를 명시적으로 모델링하는 새로운 스켈레톤 표현 방식을 제안한다. 3차원 강체 운동은 특수 유클리드 군(SE(3))의 원소이므로, 제안하는 스켈레톤 표현은 SE(3)×…×SE(3)라는 리 군(Lie group)에 위치하며, 이는 곡면(manifold) 구조를 가진다. 제안된 표현 방식을 통해 인간의 행동은 이 리 군 내의 곡선(curve)으로 모델링할 수 있다. 그러나 이러한 리 군 내의 곡선 분류는 복잡한 과제이므로, 우리는 행동 곡선을 리 군에서 그 리 대수(Lie algebra)로 매핑한다. 리 대수는 벡터 공간이므로, 이후 동적 시간 왜곡(DTW, Dynamic Time Warping), 푸리에 시간 피라미드 표현(Fourier Temporal Pyramid Representation), 그리고 선형 SVM(Linear SVM)을 결합한 방식을 사용하여 분류를 수행한다. 세 가지 행동 데이터셋에 대한 실험 결과, 제안된 표현 방식은 기존의 많은 스켈레톤 표현 방식보다 우수한 성능을 보였으며, 다양한 최신 기술 기반의 스켈레톤 기반 인간 행동 인식 방법들에 비해도 우위를 보였다.

3D 스켈레톤을 리 군 내 점으로 표현함을 통한 인간 행동 인식 | 최신 연구 논문 | HyperAI초신경