HyperAIHyperAI
il y a 17 jours

Apprentissage de la régularité par modélisation explicite de la distribution pour la détection d’anomalies dans les vidéos squelettiques

Shoubin Yu, Zhongyin Zhao, Haoshu Fang, Andong Deng, Haisheng Su, Dongliang Wang, Weihao Gan, Cewu Lu, Wei Wu
Apprentissage de la régularité par modélisation explicite de la distribution pour la détection d’anomalies dans les vidéos squelettiques
Résumé

La détection d’anomalies dans les vidéos de surveillance est un défi majeur et essentiel pour assurer la sécurité publique. Contrairement aux méthodes basées sur les pixels, les approches fondées sur les poses exploitent des données squelettiques hautement structurées, ce qui réduit la charge computationnelle tout en atténuant l’impact néfaste du bruit ambiant. Toutefois, à la différence des méthodes basées sur les pixels, capables d’exploiter directement des caractéristiques de mouvement explicites telles que le flux optique, les méthodes basées sur les poses souffrent du manque de représentations dynamiques alternatives. Dans cet article, nous proposons un nouveau module appelé Motion Embedder (ME), conçu pour fournir une représentation du mouvement à partir d’une perspective probabiliste. Par ailleurs, nous introduisons un nouveau modèle spécifique à la tâche, le Spatial-Temporal Transformer (STT), déployé pour une reconstruction auto-supervisée des séquences de poses. Ces deux modules sont intégrés dans un cadre unifié permettant l’apprentissage de la régularité des poses, désigné sous le nom de Motion Prior Regularity Learner (MoPRL). MoPRL atteint des performances de pointe, avec une amélioration moyenne de 4,7 % en AUC sur plusieurs jeux de données exigeants. Des expérimentations étendues confirment la polyvalence de chacun des modules proposés.