12일 전
인간 뼈대 및 변화 탐지 기반 효율적인 감시 영상 내 폭력 탐지
{Juan C. San Miguel, Guillermo Garcia-Cobo}
초록
우리가 지속적으로 감시하고 있는 세계에서 감시 카메라는 공공 공간에서 범죄와 폭력 행위를 억제하는 데 중요한 역할을 하며, 범죄 예방 수단으로서의 위협 효과를 발휘한다. 이러한 효과를 더욱 높이기 위해 실시간으로 범죄를 탐지할 수 있는 자동화 도구의 필요성이 점점 커지고 있다. 본 논문에서는 감시 영상에서 폭력 범죄를 정확하고 효율적으로 탐지하기 위한 새로운 딥러닝 아키텍처를 제안한다. 우리는 폭력 행위 탐지에 있어 가장 핵심적인 정보로 인간의 신체와 그 상호작용을 고려한다. 이를 위해 인간의 자세를 추출하는 모듈과 변화 감지 모듈을 제안하는 아키텍처의 입력으로 활용한다. 이후, 하나의 입력이 0 값을 가지더라도 정보 전달이 보장되도록 곱셈이 아닌 덧셈 기반의 새로운 결합 방식을 도입하여 기존 문헌에서 제시된 다양한 결합 방법보다 우수한 성능을 달성한다. 마지막으로 공간적 및 시간적 정보를 동시에 고려하기 위해 표준 LSTM의 컨볼루션 기반 대안인 ConvLSTM을 사용한다. 여러 벤치마크 데이터셋에서 수행된 실험 결과는 제안된 방법이 뛰어난 정확도와 효율성을 보이며, 훨씬 적은 학습 가능한 파라미터로 최신 기술 수준(SOTA)의 성능을 달성함을 입증한다. 제안된 아키텍처를 재현할 수 있도록 코드를 공개하였으며, GitHub 링크를 통해 제공된다: https://github.com/atmguille/Violence-Detection-With-Human-Skeletons