17일 전

CNN과 LSTM을 이용한 비디오에서의 강건한 실시간 폭력 탐지

{Rana F. Al-Tuma, almamon rasool abdali}
초록

감시 시스템에서 폭력 사건을 탐지하는 것은 법집행 및 도시 안전 분야에서 중요한 역할을 하고 있다. 폭력 사건 탐지기의 성능은 반응 속도, 정확도, 그리고 다양한 형식의 영상 자원(다양한 종류의 비디오 소스)에 대한 일반화 능력으로 평가된다. 기존 연구들은 주로 반응 속도 또는 정확도에 초점을 맞추었으나, 다양한 영상 소스에 대한 일반화 능력은 고려하지 않았다. 본 논문에서는 딥러닝 기법을 기반으로 한 실시간 폭력 사건 탐지기 모델을 제안한다. 제안된 모델은 공간적 특징 추출을 담당하는 CNN과 시계열 관계 학습을 수행하는 LSTM을 결합한 구조로, 전체적인 일반성, 정확도, 빠른 반응 시간이라는 세 가지 핵심 요소를 동시에 고려하였다. 제안된 모델은 초당 131 프레임의 속도로 98%의 정확도를 달성하였다. 기존 연구들과의 정확도 및 속도 비교를 통해, 본 모델이 폭력 사건 탐지 분야에서 기존 연구들 중 가장 높은 정확도와 가장 빠른 처리 속도를 제공함을 입증하였다.

CNN과 LSTM을 이용한 비디오에서의 강건한 실시간 폭력 탐지 | 최신 연구 논문 | HyperAI초신경