FastAno : Détection rapide d'anomalies par transformation de patches spatio-temporels

La détection d’anomalies dans les vidéos a suscité un intérêt croissant en raison de la demande accrue en surveillance automatique des vidéos de surveillance. En particulier, les approches basées sur la prédiction constituent l’une des méthodes les plus étudiées pour détecter les anomalies, en prédisant les cadres contenant des événements anormaux dans l’ensemble de test après apprentissage à partir des cadres normaux de l’ensemble d’entraînement. Toutefois, de nombreuses architectures de prédiction s’avèrent très coûteuses en termes de calcul en raison de l’utilisation de réseaux pré-entraînés pour le flux optique, ou échouent à détecter les situations anormales en raison de leur forte capacité générative, capable de prédire même les anomalies. Pour remédier à ces limites, nous proposons deux transformations : la transformation par rotation spatiale (SRT) et la transformation par mélange temporel (TMT), visant à générer des cuboïdes irréguliers à partir de cuboïdes de cadres normaux, afin d’améliorer l’apprentissage des caractéristiques normales. En outre, la transformation par patch n’est appliquée qu’en phase d’entraînement, permettant à notre modèle de détecter rapidement les cadres anormaux lors de l’inférence. Notre modèle a été évalué sur trois benchmarks de détection d’anomalies, atteignant une précision compétitive et surpassant tous les travaux antérieurs en termes de vitesse.