Command Palette
Search for a command to run...
Détection d'anomalies dans les vidéos de surveillance en situation réelle
Détection d'anomalies dans les vidéos de surveillance en situation réelle
Sultani Waqas Chen Chen Shah Mubarak
Résumé
Les vidéos de surveillance sont capables de capturer une grande variété d’anomalies réalistes. Dans cet article, nous proposons d’apprendre à détecter les anomalies en exploitant à la fois des vidéos normales et anormales. Pour éviter d’annoter manuellement les segments ou extraits anormaux présents dans les vidéos d’entraînement — une tâche très chronophage —, nous proposons d’apprendre la détection d’anomalies via un cadre d’ordonnancement multi-instance profond, en exploitant des vidéos d’entraînement étiquetées de manière faible, c’est-à-dire que les étiquettes (anormales ou normales) sont attribuées au niveau de la vidéo entière, et non au niveau des extraits. Dans notre approche, nous considérons les vidéos normales et anormales comme des « sacs » (bags), et les segments vidéo comme des « instances » dans le cadre d’un apprentissage multi-instance (MIL). Ainsi, nous apprenons automatiquement un modèle profond d’ordonnancement des anomalies, capable de prédire des scores élevés d’anomalie pour les segments vidéo anormaux. En outre, nous introduisons des contraintes de parcimonie et de régularité temporelle dans la fonction de perte d’ordonnancement, afin d’améliorer la localisation précise des anomalies pendant l’entraînement. Nous présentons également un nouveau jeu de données à grande échelle, le premier de son genre, comprenant 128 heures de vidéos. Ce jeu de données se compose de 1 900 vidéos réelles de surveillance longues et non tronquées, incluant 13 types d’anomalies réalistes — telles que des bagarres, des accidents de la route, des cambriolages, des vols — ainsi que des activités normales. Ce jeu de données peut être utilisé pour deux tâches : premièrement, la détection d’anomalies générales, en regroupant toutes les anomalies dans une catégorie et toutes les activités normales dans une autre ; deuxièmement, la reconnaissance de chacune des 13 activités anormales. Nos résultats expérimentaux montrent que notre méthode MIL pour la détection d’anomalies permet d’atteindre une amélioration significative par rapport aux approches les plus avancées de l’état de l’art. Nous fournissons également les résultats de plusieurs modèles de base récents basés sur l’apprentissage profond pour la reconnaissance des activités anormales. La faible performance de reconnaissance observée sur ces modèles révèle que notre jeu de données est particulièrement exigeant, ouvrant ainsi de nombreuses perspectives pour des travaux futurs. Le jeu de données est disponible à l’adresse suivante : https://webpages.uncc.edu/cchen62/dataset.html