8일 전

데이터셋 간 인간 행동 인식을 위한 전경 가중 히스토그램 분해

{Waqas Sultani, Imran Saleemi}
데이터셋 간 인간 행동 인식을 위한 전경 가중 히스토그램 분해
초록

이 논문은 훈련 데이터셋과 테스트 데이터셋이 서로 다를 때, 특히 테스트 영상이 훈련 과정에서 레이블링되지 않으며 가용하지 않는 상황에서 인간 행동 인식 문제를 다루고자 한다. 이러한 맥락에서 공동 어휘 학습 또는 도메인 전이 기법은 적용될 수 없다. 본 연구에서는 새로운 데이터셋에서 테스트할 경우 분류기 성능이 저하되는 원인을 탐구하고, 장면 배경이 행동 표현과 인식에 미치는 영향을 정량화한다. 최근 데이터셋에서의 배경 장면이 상당히 구분 가능함을 보이고, 단지 배경 특징과 지스트 특징 공간의 분할만을 사용하여도 합리적인 정확도로 행동을 분류할 수 있음을 보여준다. 이후 우리는 3차원 MRF 기반 프레임워크를 활용하여 움직임, 외형, 주목성 정보를 종합적으로 고려하여 영상의 각 픽셀이 전경 영역임에 대한 신뢰도를 측정하는 새로운 프로세스를 제안한다. 또한 전경 신뢰도를 활용하는 다양한 방법을 제안한다. 이를 통해 bag-of-words 어휘의 개선, 영상의 히스토그램 표현 향상, 그리고 새로운 히스토그램 분해 기반 표현 및 커널의 도입을 가능하게 한다. 제안한 전경 신뢰도를 활용하여 하나의 데이터셋에서 훈련된 행동 인식 모델이 다른 데이터셋에서 테스트되는 경우에도 성능을 개선하였다. 여러 데이터셋에 걸쳐 광범위한 실험을 수행한 결과, 기존의 기준 방법 대비 교차 데이터셋 인식 정확도가 향상됨을 확인하였다.