HyperAIHyperAI
il y a 2 mois

SiamVGG : Suivi visuel à l'aide de réseaux siamois plus profonds

Yuhong Li; Xiaofan Zhang; Deming Chen
SiamVGG : Suivi visuel à l'aide de réseaux siamois plus profonds
Résumé

Récemment, nous avons assisté à un développement rapide des solutions de suivi visuel basées sur les Réseaux Neuronaux Profonds (DNN). Certains traqueurs combinent ces solutions DNN avec les Filtres de Corrélation Discriminants (DCF) pour extraire des caractéristiques sémantiques et atteindre une précision de suivi d'avant-garde. Cependant, ces solutions sont extrêmement gourmandes en ressources de calcul, nécessitant un temps de traitement long et compromettant ainsi la performance en temps réel. Pour offrir à la fois une haute précision et une performance en temps réel fiable, nous proposons un nouveau traqueur appelé SiamVGG\footnote{https://github.com/leeyeehoo/SiamVGG}. Il combine un squelette de Réseau Neuronal Convolutif (CNN) et un opérateur de corrélation croisée, exploitant les caractéristiques des images exemplaires pour améliorer la précision du suivi d'objets. L'architecture de SiamVGG est adaptée à partir du VGG-16, avec des paramètres partagés entre les images exemplaires et les trames vidéo d'entrée souhaitées. Nous évaluons le SiamVGG proposé sur les jeux de données OTB-2013/50/100 et VOT 2015/2016/2017, où il atteint une précision d'avant-garde tout en maintenant une performance en temps réel satisfaisante de 50 FPS sur une carte graphique GTX 1080Ti. Notre conception permet d'obtenir un chevauchement moyen attendu (EAO) 2% plus élevé que celui des méthodes ECO et C-COT dans le cadre du défi VOT2017.

SiamVGG : Suivi visuel à l'aide de réseaux siamois plus profonds | Articles de recherche récents | HyperAI