8일 전

딥 타임스탬프 인코딩-디코딩을 활용한 다중 인스턴스 기반 비디오 이상 탐지

Ammar Mansoor Kamoona, Amirali Khodadadian Gosta, Alireza Bab-Hadiashar, Reza Hoseinnezhad
딥 타임스탬프 인코딩-디코딩을 활용한 다중 인스턴스 기반 비디오 이상 탐지
초록

본 논문에서는 다중 인스턴스 학습(Multiple Instance Learning, MIL) 프레임워크를 기반으로 한 약한 지도 학습(weakly supervised) 딥 시간 인코딩-디코딩 기반의 이상 탐지 기법을 제안한다. 이 방법은 감시 영상에서 이상 행위를 탐지하는 데 활용되며, 학습 단계에서 정상 및 비정상 영상 클립을 모두 사용한다. 제안된 접근법은 영상을 '백(Bag)'으로 간주하고, 영상 클립을 그 안에 포함된 '인스턴스(Instance)'로 간주하는 다중 인스턴스 학습 구조를 기반으로 한다. 본 연구의 주요 기여는 영상 인스턴스 간의 시간적 관계를 고려하는 새로운 접근법을 제안한 점이다. 기존의 독립적인 인스턴스로 간주하는 방식과는 달리, 본 논문은 영상 클립을 순차적인 시각적 데이터로 간주하여 시간적 흐름을 반영한다. 이를 위해 영상 인스턴스의 공간-시간적 진화를 효과적으로 포착할 수 있도록 설계된 딥 시간 인코더 네트워크를 도입한다. 또한, 최근 컴퓨터 비전 분야에서 제안된 유사한 손실 함수보다 더 매끄러운 새로운 손실 함수를 제안함으로써, 학습 과정에서 더 빠른 수렴 속도와 국소 최소값에 대한 더 높은 내성(로버스트함)을 달성한다. 제안된 시간적 인코딩-디코딩 기법과 수정된 손실 함수는 시뮬레이션 실험을 통해 최신 기술들과 비교 평가되었다. 실험 결과, 제안한 방법은 감시 영상에서의 이상 탐지에 있어 기존 최고 수준의 기법들과 유사하거나 더 우수한 성능을 보였다.

딥 타임스탬프 인코딩-디코딩을 활용한 다중 인스턴스 기반 비디오 이상 탐지 | 최신 연구 논문 | HyperAI초신경