12일 전

3D 골격 데이터로부터 인간 행동 인식을 위한 롤링 회전

{Rama Chellappa, Raviteja Vemulapalli}
3D 골격 데이터로부터 인간 행동 인식을 위한 롤링 회전
초록

최근 깊이 센서의 보급과 실시간 깊이 기반 3차원 스켈레톤 추정 알고리즘의 발전으로 인해, 스켈레톤 기반 인간 행동 인식은 다양한 연구 공동체에서 큰 관심을 받고 있다. 본 연구에서는 3차원 스켈레톤 데이터로부터 인간 행동을 인식하기 위해 롤링 맵(rolling map)을 활용한다. 롤링 맵은 수학적으로 엄밀히 정의된 개념이지만, 비전 분야에서는 아직 충분히 탐색되지 않은 분야이다. 먼저, 각 스켈레톤을 다양한 신체 부위 간의 상대적인 3차원 회전으로 표현한다. 3차원 회전은 특수 직교군 SO(3)의 원소이므로, 본 연구의 스켈레톤 표현은 SO(3) × ... × SO(3)라는 리 군(Lie group)의 점이 되며, 이는 리만 다양체(Riemannian manifold)이기도 하다. 이후 이러한 표현을 기반으로 인간 행동을 이 리 군 내의 곡선(curve)으로 모델링한다. 비유클리드 공간에서 곡선의 분류는 매우 어려운 과제이므로, 로그 맵(logarithm map)과 롤링 맵을 결합하여 행동 곡선을 리 대수 so(3) × ... × so(3) (벡터 공간)로 전개하고, 이 벡터 공간에서 분류를 수행한다. 세 가지 행동 데이터셋에 대한 실험 결과, 제안하는 방법이 최신 기술과 비교하여 동등하거나 더 뛰어난 성능을 보였다.

3D 골격 데이터로부터 인간 행동 인식을 위한 롤링 회전 | 최신 연구 논문 | HyperAI초신경