HyperAIHyperAI

Command Palette

Search for a command to run...

Réseau à deux voies efficace pour la détection de la violence utilisant un LSTM convolutif séparable

Zahidul Islam Mohammad Rukonuzzaman Raiyan Ahmed Md. Hasanul Kabir Moshiur Farazi

Résumé

La détection automatique de violences à partir de vidéos de surveillance constitue une sous-catégorie de la reconnaissance d’activités qui mérite une attention particulière en raison de son large potentiel d’application dans les systèmes de surveillance sans personnel, le filtrage vidéo sur Internet, etc. Dans ce travail, nous proposons une architecture efficace à deux flux basée sur l’apprentissage profond, exploitant le SepConvLSTM (LSTM à convolution séparable) et MobileNet pré-entraîné. Un flux reçoit comme entrée des images avec suppression du fond, tandis que l’autre traitement se concentre sur la différence entre cadres adjacents. Nous avons mis en œuvre des techniques simples et rapides de prétraitement des entrées, visant à mettre en évidence les objets en mouvement en supprimant les arrière-plans statiques et à capturer les mouvements intercadres. Étant donné que les actions violentes sont principalement caractérisées par des mouvements corporels, ces entrées permettent de générer des caractéristiques discriminantes. Le SepConvLSTM est conçu en remplaçant l’opération de convolution à chaque porte du ConvLSTM par une convolution séparable en profondeur, ce qui permet de produire des caractéristiques spatio-temporelles robustes sur de longues portées tout en utilisant significativement moins de paramètres. Nous avons expérimenté trois méthodes de fusion pour combiner les cartes de caractéristiques issues des deux flux. L’évaluation des méthodes proposées a été effectuée sur trois jeux de données publics standard. Notre modèle dépasse l’exactitude sur le jeu de données RWF-2000, plus grand et plus exigeant, de plus de 2 %, tout en atteignant des résultats au niveau de l’état de l’art sur les jeux de données plus petits. Nos expérimentations nous amènent à conclure que les modèles proposés se distinguent par une meilleure efficacité computationnelle ainsi que par une précision de détection supérieure.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Réseau à deux voies efficace pour la détection de la violence utilisant un LSTM convolutif séparable | Articles | HyperAI