초록
본 논문에서는 자세의 컴팩트한 표현으로서 3차원 관절 위치의 히스토그램(HOJ3D)을 활용한 인간 동작 인식을 위한 새로운 접근법을 제안한다. 우리는 Kinect의 깊이 맵에서 Shotton 등[6]의 방법을 사용하여 3차원 뼈대 관절 위치를 추출한다. 동작 깊이 시퀀스로부터 계산된 HOJ3D는 선형 판별 분석(LDA)을 이용해 재투영된 후, k개의 자세 시각 단어로 군집화되며, 이는 동작의 대표적인 자세를 나타낸다. 이러한 시각 단어의 시간적 변화는 이산형 은닉 마르코프 모델(HMM)로 모델링된다. 또한, 구면 좌표계의 설계 및 Kinect를 통한 강건한 3차원 뼈대 추정 방식 덕분에, 제안하는 방법은 제시된 3차원 동작 데이터셋에서 뚜렷한 시점 불변성(뷰 인버전스)을 보인다. 본 연구에서 사용한 데이터셋은 10명의 개인이 다양한 시점에서 수행한 10가지 실내 활동에 대한 총 200개의 3차원 시퀀스로 구성되어 있다. 제안된 방법은 실시간 처리가 가능하며, 도전적인 3차원 동작 데이터셋에서 뛰어난 성능을 달성한다. 또한 MSR Action 3D 데이터셋에서도 실험을 수행한 결과, 대부분의 경우 Li 등[25]의 방법보다 더 우수한 성능을 보였다.