HyperAIHyperAI
il y a 17 jours

Un modèle de contexte hiérarchique pour la reconnaissance d’événements dans les vidéos de surveillance

{Qiang Ji, Xiaoyang Wang}
Un modèle de contexte hiérarchique pour la reconnaissance d’événements dans les vidéos de surveillance
Résumé

En raison des défis importants tels que les grandes variations intra-classes et la faible résolution d’image, l’information contextuelle joue un rôle de plus en plus crucial pour une reconnaissance précise et robuste des événements dans les vidéos de surveillance. L’information contextuelle peut généralement être divisée en trois niveaux : le contexte au niveau des caractéristiques, le contexte au niveau sémantique, et le contexte au niveau a priori. Ces trois niveaux fournissent respectivement des informations essentielles de bas en haut, de niveau intermédiaire et de haut en bas, qui peuvent bénéficier directement à la tâche de reconnaissance. Contrairement aux travaux existants qui intègrent généralement l’information contextuelle à l’un de ces trois niveaux, nous proposons un modèle hiérarchique de contexte qui exploite simultanément les contextes aux trois niveaux et les intègre de manière systématique à la reconnaissance des événements. Pour surmonter les défis d’apprentissage et d’inférence posés par la hiérarchie du modèle, nous avons développé des algorithmes complets d’apprentissage et d’inférence pour le modèle hiérarchique proposé, fondés sur la méthode de Bayes variationnelle. Des expériences menées sur les jeux de données VIRAT 1.0 et 2.0 Ground démontrent l’efficacité du modèle hiérarchique de contexte proposé pour améliorer les performances de reconnaissance des événements, même face à des défis importants tels que de grandes variations intra-classes et une faible résolution d’image.