Compression de caractéristiques profondes contextuelles pour le suivi visuel haute vitesse

Nous proposons un nouveau cadre de suivi basé sur des filtres de corrélation contextuels pour atteindre à la fois une vitesse de calcul élevée et des performances de pointe parmi les traceurs en temps réel. La principale contribution à la vitesse de calcul élevée réside dans la compression de caractéristiques profondes proposée, qui est réalisée par un schéma contextuel utilisant plusieurs auto-encodeurs experts ; dans notre cadre, un contexte fait référence à la catégorie grossière de l'objectif suivi selon les motifs d'apparence. Pendant la phase de pré-entraînement, un auto-encodeur expert est entraîné pour chaque catégorie. Pendant la phase de suivi, le meilleur auto-encodeur expert est sélectionné pour une cible donnée, et seul cet auto-encodeur est utilisé. Pour obtenir des performances de suivi élevées avec la carte de caractéristiques compressée, nous introduisons des processus d'élimination du bruit extrinsèque et un nouveau terme de perte d'orthogonalité pour le pré-entraînement et le réglage fin des auto-encodeurs experts. Nous validons le cadre contextuel proposé au moyen d'une série d'expériences, où notre méthode atteint des performances comparables à celles des traceurs de pointe qui ne peuvent pas fonctionner en temps réel, tout en fonctionnant à une vitesse considérablement rapide supérieure à 100 images par seconde (fps).