인간 행동 인식은 컴퓨터 비전 및 패턴 인식 분야에서 매우 활발한 연구 주제이다. 최근 들어, 새로운 RGB-D 센서를 통해 캡처된 3차원(3D) 깊이 데이터를 활용한 인간 행동 인식에 큰 잠재력이 드러나고 있다. 깊이 기반 행동 인식을 위한 여러 가지 특징(feature)과/또는 알고리즘이 제안되어 왔다. 이에 대해 다음과 같은 질문이 제기된다: 깊이 기반 행동 인식의 정확도를 크게 향상시키기 위해 보완적인 특징을 찾고 이를 결합할 수 있는가? 이 질문에 답하고 문제를 보다 깊이 이해하기 위해, 본 연구에서는 깊이 기반 행동 인식에서 다양한 특징의 융합(fusion)을 체계적으로 탐구한다. 비록 데이터 융합은 다른 분야에서는 큰 성공을 거두었지만, 3D 행동 인식 분야에서는 아직 충분히 연구되지 않은 상태이다. 예를 들어, 깊이 기반 행동 인식에 있어 융합이 실제로 유용한지 여부, 그리고 어떻게 적절히 융합할 것인지 등의 문제들이 남아 있다. 본 논문에서는 깊이 영상에서 행동을 특성화하기 위해 다양한 특징을 사용하여, 서로 다른 수준의 융합 전략을 종합적으로 연구한다. 구체적으로 특징 수준(feature level)과 결정 수준(decision level)의 두 가지 융합 방식을 탐색하며, 각 수준에서 다양한 융합 방법을 검토한다. 행동 패턴을 다양한 관점에서 설명하기 위해 네 가지 서로 다른 특징을 고려하였다. 이를 검증하기 위해 네 가지 도전적인 깊이 행동 데이터베이스에서 실험을 수행하여, 일반적으로 최적의 융합 방법을 평가하고 도출하였다. 실험 결과에 따르면, 본 논문에서 다룬 네 가지 특징은 서로 보완적인 성질을 가지며, 적절한 융합 전략을 적용할 경우 각각의 개별 특징보다 인식 정확도를 크게 향상시킬 수 있음을 확인하였다. 더욱 중요한 것은, 본 연구에서 제안한 융합 기반 행동 인식 방법이 이들 도전적인 데이터베이스에서 기존의 최첨단 기법들을 모두 상회함을 보였다.