17일 전

감시 영상에서 사건 인식을 위한 계층적 컨텍스트 모델

{Qiang Ji, Xiaoyang Wang}
감시 영상에서 사건 인식을 위한 계층적 컨텍스트 모델
초록

감시 영상에서 정확하고 견고한 이벤트 인식을 달성하기 위해 맥락 정보는 점점 더 중요한 역할을 하고 있다. 이는 클래스 내 변동성이 크고 이미지 해상도가 낮은 등 큰 도전 과제가 존재하기 때문이다. 일반적으로 맥락 정보는 특징 수준의 맥락, 의미 수준의 맥락, 사전 지식 수준의 맥락으로 나눌 수 있다. 이러한 세 가지 수준의 맥락은 각각 하향식, 중간 수준, 상향식 정보를 제공하며, 이는 이벤트 인식 작업 자체에 큰 도움을 준다. 기존의 연구들은 일반적으로 세 가지 수준 중 하나의 맥락 정보만 통합하는 방식을 사용하지만, 본 연구에서는 세 수준의 맥락 정보를 동시에 활용하고 체계적으로 이벤트 인식에 통합하는 계층적 맥락 모델을 제안한다. 모델의 계층 구조로 인해 발생하는 학습 및 추론의 도전 과제를 해결하기 위해, 변분 베이즈 방법을 기반으로 제안된 계층적 맥락 모델에 대한 완전한 학습 및 추론 알고리즘을 개발하였다. VIRAT 1.0 및 2.0 지상 데이터셋에서의 실험 결과는, 클래스 내 큰 변동성과 낮은 이미지 해상도와 같은 심각한 도전 상황에서도 제안된 계층적 맥락 모델이 이벤트 인식 성능을 향상시키는 데 효과적임을 입증하였다.