비디오에서 자기 지도 및 다중 작업 학습을 통한 이상 탐지

비디오에서의 이상 탐지는 어려운 컴퓨터 비전 문제입니다. 훈련 시점에 이상 이벤트가 부족하기 때문에, 이상 탐지는 완전한 감독 없이 학습 방법을 설계해야 합니다. 본 논문에서는 객체 수준에서 자기 지도 학습과 다중 작업 학습을 통해 비디오에서의 이상 이벤트 탐지를 접근합니다. 먼저 사전 훈련된 검출기를 사용하여 객체를 검출합니다. 그런 다음, 여러 프록시 작업을 동시에 학습하여 차별적인 이상 특异性 정보를 생성하는 3D 컨볼루션 신경망을 훈련시킵니다. 이 프록시 작업은 세 가지 자기 지도 학습과 한 가지 지식 증류 기반 학습으로 구성됩니다. 자기 지도 학습 작업은 다음과 같습니다: (i) 전진/후진 움직이는 객체의 구분(시간의 화살표), (ii) 연속적/간헐적 프레임 내 객체의 구분(움직임 불규칙성), (iii) 객체 특异性 외관 정보의 재구성입니다. 지식 증류 작업은 분류와 검출 정보를 모두 고려하며, 이상이 발생할 때 선생님 모델과 학생 모델 간에 큰 예측 차이를 생성합니다. 우리所知에 따르면, 우리는 비디오에서의 이상 이벤트 탐지를 다중 작업 학습 문제로 접근한 최초의 연구이며, 단일 아키텍처에서 여러 자기 지도 학습과 지식 증류 프록시 작업을 통합하였습니다. 우리의 경량 아키텍처는 Avenue, ShanghaiTech 및 UCSD Ped2 세 개 벤치마크에서 최신 방법들을 능가합니다. 또한, 우리는 아블레이션 연구를 수행하여 다중 작업 학습 설정에서 자기 지도 학습과 정상성 특异性 증류를 통합하는 중요성을 입증하였습니다.注:在最后一句中,“我们所知”被翻译为“우리所知”,这是中文词汇误入韩文的情况。正确的翻译应该是“우리가 알고 있는 바에 따르면”。以下是修正后的版本:비디오에서의 이상 탐지는 어려운 컴퓨터 비전 문제입니다. 훈련 시점에 이상 이벤트가 부족하기 때문에, 이상 탐지는 완전한 감독 없이 학습 방법을 설계해야 합니다. 본 논문에서는 객체 수준에서 자기 지도 학습과 다중 작업 학습을 통해 비디오에서의 이상 이벤트 탐지를 접근합니다. 먼저 사전 훈련된 검출기를 사용하여 객체를 검출합니다. 그런 다음, 여러 프록시 작업을 동시에 학습하여 차별적인 이상 특이성 정보를 생성하는 3D 컨볼루션 신경망을 훈련시킵니다. 이 프록시 작업은 세 가지 자기 지도 학습과 한 가지 지식 증류 기반 학습으로 구성됩니다. 자기 지도 학습 작업은 다음과 같습니다: (i) 전진/후진 움직이는 객체의 구분(시간의 화살표), (ii) 연속적/간헐적 프레임 내 객체의 구분(움직임 불규칙성), (iii) 객체 특이성 외관 정보의 재구성입니다. 지식 증류 작업은 분류와 검출 정보를 모두 고려하며, 이상이 발생할 때 선생님 모델과 학생 모델 간에 큰 예측 차이를 생성합니다. 우리가 알고 있는 바에 따르면, 우리는 비디오에서의 이상 이벤트 탐지를 다중 작업 학습 문제로 접근한 최초의 연구이며, 단일 아키텍처에서 여러 자기 지도 학습과 지식 증류 프록시 작업을 통합하였습니다. 우리의 경량 아키텍처는 Avenue, ShanghaiTech 및 UCSD Ped2 세 개 벤치마크에서 최신 방법들을 능가합니다. 또한, 우리는 아블레이션 연구를 수행하여 다중 작업 학습 설정에서 자기 지도 학습과 정상성 특이성 증류를 통합하는 중요성을 입증하였습니다.