대비 정규화를 적용한 U-Net을 이용한 비디오 이상 탐지
비디오 이상 탐지(Video Anomaly Detection)는 비디오 내 이상 구간을 식별하는 것을 목표로 한다. 일반적으로 약한 감독(weakly supervised) 방식의 비디오 수준 레이블을 사용하여 학습된다. 본 논문은 비디오 이상 탐지 모델 성능에 영향을 미치는 두 가지 핵심 요인에 초점을 맞춘다. 첫째, 지역적(local) 및 전역적(global) 시간적 종속성( temporal dependencies)을 보다 효과적으로 포착하는 방법을 탐구한다. 기존의 아키텍처는 지역적 또는 전역적 정보 중 하나는 효과적으로 학습할 수 있지만, 둘 다 동시에 처리하기는 어렵다. 본 연구에서는 U-Net과 유사한 구조를 도입하여 두 가지 종속성을 통합된 구조 내에서 모델링한다. 여기서 인코더는 지역적 정보 위에 계층적으로 전역적 종속성을 학습하고, 디코더는 이 전역 정보를 다시 세그먼트 수준으로 전파하여 분류에 활용한다. 둘째, 제한된 학습 데이터로 인해 비디오 이상 탐지에서 과적합(overfitting) 문제가 심각한 문제로 작용한다. 이를 해결하기 위해, 특징 기반(feature-based) 접근 방식을 채택한 약한 감독 대비 정규화(weakly supervised contrastive regularization)를 제안한다. 대비 정규화는 클래스 간 분리성(inter-class separability)과 클래스 내 밀도성(intra-class compactness)을 강제함으로써 보다 일반화 가능한 특징을 학습한다. UCF-Crime 데이터셋에서 실시한 광범위한 실험 결과, 제안한 방법이 여러 최신 기법들을 상회함을 확인하였다.