Réseaux neuronaux génératifs pour la détection d'anomalies dans des scènes surpeuplées
La surveillance de sécurité est essentielle à l’harmonie sociale et à la tranquillité de la vie des individus. Elle joue un rôle déterminant dans le renforcement de la stabilité sociale et la protection de la vie humaine. La détection rapide, efficace et précise des anomalies dans les vidéos de surveillance reste un défi majeur. Ce papier propose une nouvelle approche, nommée S²-VAE, pour la détection d’anomalies à partir de données vidéo. Le modèle S²-VAE repose sur deux réseaux neuronaux innovants : un Auto-encodeur Variationnel à Connexions Entières Empilées (S F -VAE) et un Auto-encodeur Variationnel Convolutionnel à sauts (S C -VAE). Le S F -VAE est un réseau génératif léger permettant d’obtenir un modèle, tel qu’un mélange de Gaussiennes, adapté à la distribution des données réelles. Le S C -VAE, composant clé du modèle S²-VAE, est un réseau génératif profond qui exploite les avantages des réseaux de neurones convolutifs (CNN), des auto-encodeurs variationnels (VAE) et des connexions par saut (skip connections). À la fois efficaces et performants, les réseaux S F -VAE et S C -VAE permettent d’atteindre de meilleurs résultats dans la détection à la fois des événements anormaux locaux et globaux. L’approche proposée S²-VAE a été évaluée sur quatre jeux de données publics. Les résultats expérimentaux démontrent que S²-VAE surpasser les algorithmes les plus avancés de l’état de l’art. Le code source est disponible publiquement à l’adresse suivante : https://github.com/tianwangbuaa/.