
초록
상용 깊이 센서가 제공하는 깊이 정보를 기반으로 한 인간 행동 인식은 중요한 동시에 도전적인 과제이다. 노이즈가 많은 깊이 맵, 행동 시퀀스의 길이 차이, 그리고 행동 수행 시 자유로운 스타일 등은 동일 클래스 내에서 큰 변동성을 초래할 수 있다. 본 논문에서는 깊이 기반 인간 행동 인식을 위한 새로운 프레임워크를 제안한다. 이 프레임워크는 희소 코딩(sparse coding)과 시간적 피라미드 매칭(temporal pyramid matching, TPM)을 기반으로 하며, 특히 희소 코딩을 위한 구분력 있는 클래스별 사전 학습 알고리즘을 제안한다. 그룹 희소성(group sparsity)과 기하학적 제약 조건을 추가함으로써, 동일한 클래스에 속하는 하위 사전(sub-dictionary)을 통해 특징을 효과적으로 재구성할 수 있으며, 계산된 계수들 내에서 특징 간의 기하학적 관계도 잘 유지된다. 제안된 방법은 깊이 카메라로 촬영된 두 개의 벤치마크 데이터셋에서 평가되었다. 실험 결과, 제안된 알고리즘이 기존 최고 수준의 알고리즘들에 비해 반복적으로 우수한 성능을 보였다. 또한, 제안된 사전 학습 방법은 기존의 전형적인 사전 학습 접근법보다도 뛰어난 성능을 나타냈다.