
초록
감시 영상에서의 이상 탐지는 이상 영상 콘텐츠와 지속 시간의 다양성으로 인해 도전적인 과제이다. 본 논문에서는 약한 감독 하에서 영상 클립의 이상 점수에 대해 회귀 문제로 이상 탐지를 접근한다. 이를 위해 학습 단계에서 영상 수준의 레이블만 요구하는 이상 탐지 프레임워크인 Anomaly Regression Net(AR-Net)을 제안한다. 또한, 이상 탐지에 적합한 구분 능력을 갖춘 특징을 학습하기 위해 제안된 AR-Net에 대해 동적 다중 인스턴스 학습 손실과 중심 손실(centroid loss)을 설계하였다. 전자는 이상 인스턴스와 정상 인스턴스 간의 클래스 간 거리를 확대하는 데 사용되며, 후자는 정상 인스턴스 내부의 클래스 내 거리를 줄이는 데 목적을 둔다. 본 연구에서는 도전적인 기준 데이터셋인 ShanghaiTech에서 종합적인 실험을 수행하였으며, 제안한 방법은 ShanghaiTech 데이터셋에서 영상 이상 탐지 분야에서 새로운 최고 성능(SOTA) 결과를 달성하였다.