HyperAIHyperAI
il y a 16 jours

Réseau à deux voies efficace pour la détection de la violence utilisant un LSTM convolutif séparable

Zahidul Islam, Mohammad Rukonuzzaman, Raiyan Ahmed, Md. Hasanul Kabir, Moshiur Farazi
Réseau à deux voies efficace pour la détection de la violence utilisant un LSTM convolutif séparable
Résumé

La détection automatique de violences à partir de vidéos de surveillance constitue une sous-catégorie de la reconnaissance d’activités qui mérite une attention particulière en raison de son large potentiel d’application dans les systèmes de surveillance sans personnel, le filtrage vidéo sur Internet, etc. Dans ce travail, nous proposons une architecture efficace à deux flux basée sur l’apprentissage profond, exploitant le SepConvLSTM (LSTM à convolution séparable) et MobileNet pré-entraîné. Un flux reçoit comme entrée des images avec suppression du fond, tandis que l’autre traitement se concentre sur la différence entre cadres adjacents. Nous avons mis en œuvre des techniques simples et rapides de prétraitement des entrées, visant à mettre en évidence les objets en mouvement en supprimant les arrière-plans statiques et à capturer les mouvements intercadres. Étant donné que les actions violentes sont principalement caractérisées par des mouvements corporels, ces entrées permettent de générer des caractéristiques discriminantes. Le SepConvLSTM est conçu en remplaçant l’opération de convolution à chaque porte du ConvLSTM par une convolution séparable en profondeur, ce qui permet de produire des caractéristiques spatio-temporelles robustes sur de longues portées tout en utilisant significativement moins de paramètres. Nous avons expérimenté trois méthodes de fusion pour combiner les cartes de caractéristiques issues des deux flux. L’évaluation des méthodes proposées a été effectuée sur trois jeux de données publics standard. Notre modèle dépasse l’exactitude sur le jeu de données RWF-2000, plus grand et plus exigeant, de plus de 2 %, tout en atteignant des résultats au niveau de l’état de l’art sur les jeux de données plus petits. Nos expérimentations nous amènent à conclure que les modèles proposés se distinguent par une meilleure efficacité computationnelle ainsi que par une précision de détection supérieure.

Réseau à deux voies efficace pour la détection de la violence utilisant un LSTM convolutif séparable | Articles de recherche récents | HyperAI