17일 전

비디오 이상 탐지를 위한 특징 예측 확산 모델

{Wenjun Wang, Guansong Pang, Yang Liu, Shiyu Zhang, Cheng Yan}
비디오 이상 탐지를 위한 특징 예측 확산 모델
초록

비디오 내 이상 탐지는 실제 응용 분야에서 중요한 연구 분야이자 도전적인 과제이다. 대규모의 레이블링된 이상 사건 데이터가 부족한 상황에서, 기존의 비디오 이상 탐지(VAD) 방법은 주로 정상 샘플의 분포를 학습하여 극도로 벗어난 샘플을 이상으로 탐지하는 데 집중하고 있다. 정상적인 움직임과 외관의 분포를 효과적으로 학습하기 위해, 많은 보조 네트워크가 전경 객체 또는 행동 정보를 추출하는 데 활용되고 있다. 이러한 고수준의 의미 특징은 배경에서 발생하는 노이즈를 효과적으로 필터링하여 탐지 모델에 미치는 영향을 줄이는 데 기여한다. 그러나 이러한 추가적인 의미 모델의 성능이 VAD 방법의 전체 성능에 큰 영향을 미친다. 확산 모델(DM)이 지닌 뛰어난 생성 능력과 노이즈 저항 성능에 착안하여, 본 연구에서는 비디오 프레임의 특징을 예측함으로써 이상 탐지를 수행하는 새로운 DM 기반 방법을 제안한다. 본 연구의 목적은 고수준 의미 특징 추출 모델을 추가로 도입하지 않고도 정상 샘플의 분포를 효과적으로 학습하는 것이다. 이를 위해 두 개의 노이즈 제거 확산 은닉 모듈을 구축하여 특징을 예측하고 개선한다. 첫 번째 모듈은 특징의 움직임 학습에 집중하고, 두 번째 모듈은 특징의 외관 학습에 초점을 맞춘다. 본 연구는 최초로 프레임 특징 예측을 기반으로 한 VAD에 확산 모델을 도입한 방법이다. 확산 모델의 강력한 표현 능력은 비DM 기반 특징 예측 기반 VAD 방법보다 더 정확하게 정상 특징을 예측할 수 있도록 한다. 광범위한 실험 결과는 제안된 방법이 최신 기술 대비 유의미하게 우수한 성능을 보임을 입증한다.

비디오 이상 탐지를 위한 특징 예측 확산 모델 | 최신 연구 논문 | HyperAI초신경