
초록
본 논문에서는 공간-시간 적대 네트워크(Spatio-Temporal Adversarial Networks, STAN)를 활용한 새로운 비정상 이벤트 검출 방법을 제안합니다. 우리는 양방향 ConvLSTM을 사용하여 공간-시간 특성을 고려해 프레임 간 이미지를 합성하는 공간-시간 생성기를 설계하였습니다. 제안된 공간-시간 판별기는 3D 컨볼루션 레이어를 통해 입력 시퀀스가 실제 정상인지 아닌지를 판단합니다. 이 두 개의 네트워크는 정상 패턴의 공간-시간 특징을 효과적으로 인코딩하기 위해 적대적 방식으로 훈련됩니다. 학습 후, 생성기와 판별기는 독립적으로 검출기로 사용될 수 있으며, 학습된 정상 패턴에서 벗어난 부분은 비정상으로 감지됩니다. 실험 결과, 제안된 방법은 최신 기법들과 비교하여 경쟁력 있는 성능을 달성하였음을 보여주었습니다. 또한 해석을 위해, 생성기 손실과 판별기 그래디언트를 사용하여 제안된 네트워크가 감지한 비정상 이벤트의 위치를 시각화하였습니다.