8일 전

약한 라벨이 붙은 비디오에서 이상 현상 국지화하기

Hui Lv, Chuanwei Zhou, Chunyan Xu, Zhen Cui, Jian Yang
약한 라벨이 붙은 비디오에서 이상 현상 국지화하기
초록

비디오 수준 레이블을 기반으로 한 비디오 이상 탐지는 현재까지도 도전적인 과제로 남아 있다. 기존 연구들은 비디오 시퀀스 내에 이상이 존재하는지를 구분하는 데 있어 상당한 진전을 이루었지만, 대부분의 방법들이 비디오 내에서 이상 사건을 시간 영역에서 정확히 국소화하는 데는 실패하고 있다. 본 논문에서는 이상 비디오 내의 이상 세그먼트를 시간적으로 국소화하는 데 초점을 맞춘 약한 감독 하의 이상 국소화(Weakly Supervised Anomaly Localization, WSAL) 방법을 제안한다. 이상 비디오에서 관찰되는 시각적 차이에 착안하여, 인접한 시간 세그먼트의 진화 특성을 평가함으로써 이상 세그먼트를 국소화하는 접근을 제안한다. 이를 위해 고차원적 맥락 인코딩 모델을 도입하여 의미 표현을 추출할 뿐만 아니라, 동적 변화를 측정함으로써 시간적 맥락을 효과적으로 활용할 수 있도록 한다. 또한, 공간적 맥락 정보를 극대화하기 위해 세그먼트 표현에서 직접 즉각적인 의미 정보를 추출한다. 이러한 동적 변화와 즉각적인 의미 정보를 효율적으로 통합하여 최종 이상 점수를 도출한다. 이상 탐지에서 발생할 수 있는 노이즈 간섭과 국소화 가이던스의 부재 문제를 해결하기 위해 추가적으로 강화 전략을 제안한다. 더불어, 이상 탐지 벤치마크의 다양성 요구를 충족시키기 위해, 현재 널리 사용되는 평가 벤치마크와는 크게 다른 교통 상황을 중심으로 한 새로운 교통 이상 데이터셋(Traffic Anomaly Dataset, TAD)을 수집하였다. 다양한 실험을 통해 각 구성 요소의 효과성을 검증하였으며, 제안된 방법은 UCF-Crime 및 TAD 데이터셋에서 새로운 최고 성능(SOTA)을 달성하였다.

약한 라벨이 붙은 비디오에서 이상 현상 국지화하기 | 최신 연구 논문 | HyperAI초신경