HyperAIHyperAI
il y a 13 jours

RWF-2000 : Une base de données vidéo à grande échelle ouverte pour la détection de violences

Ming Cheng, Kunjing Cai, Ming Li
RWF-2000 : Une base de données vidéo à grande échelle ouverte pour la détection de violences
Résumé

Ces dernières années, les caméras de surveillance ont été largement déployées dans les lieux publics, contribuant à une réduction significative du taux général de criminalité grâce à ces dispositifs omniprésents. En général, ces caméras ne servent qu’à fournir des indices et des preuves après la commission d’un crime, et sont rarement utilisées pour prévenir ou interrompre en temps réel les activités criminelles. La surveillance manuelle d’une grande quantité de données vidéo provenant de ces caméras est à la fois chronophage et exigeante en ressources humaines. Par conséquent, la reconnaissance automatique des comportements violents à partir de signaux vidéo devient essentielle. Ce papier présente un état de l’art des principales bases de données vidéo existantes pour la détection de la violence, et propose une nouvelle base de données, RWF-2000, comprenant 2 000 vidéos capturées par des caméras de surveillance dans des scènes réelles. Par ailleurs, nous introduisons une nouvelle méthode exploitant les avantages à la fois des réseaux de neurones convolutifs 3D (3D-CNN) et du flux optique, nommée Flow Gated Network. La méthode proposée atteint une précision de 87,25 % sur l’ensemble de test de notre base de données. La base de données et les codes sources sont actuellement accessibles au public.