
초록
우리는 비디오에서 이상 징후를 감지하기 위한 효율적인 방법을 제시합니다. 최근 합성곱 신경망의 응용은 객체 검출 및 인식, 특히 이미지에서의 합성곱 층의 잠재력을 보여주었습니다. 그러나 합성곱 신경망은 지도 학습 방식이며 학습 신호로서 라벨이 필요합니다. 우리는 혼잡한 장면을 포함한 비디오에서 이상 징후를 감지하기 위한 시공간 구조를 제안합니다. 우리의 구조는 공간 특징 표현과 공간 특징의 시간적 변화를 학습하는 두 가지 주요 구성 요소를 포함합니다. Avenue, Subway 및 UCSD 벤치마크에서 수행된 실험 결과는 우리의 방법이 최대 140 프레임당 초(fps)의 상당한 속도로 최신 기법과 유사한 감지 정확도를 확보함을 확인해주고 있습니다.