HyperAIHyperAI
il y a 11 jours

Régression transformée cible pour un suivi précis

Yutao Cui, Cheng Jiang, Limin Wang, Gangshan Wu
Régression transformée cible pour un suivi précis
Résumé

Le suivi précis reste une tâche difficile en raison des variations d'apparence, des changements de posture et de vue, ainsi que des déformations géométriques du objet cible dans les vidéos. Les traqueurs récents sans ancres proposent un mécanisme de régression efficace, mais échouent à produire une estimation précise des boîtes englobantes. Pour résoudre ces problèmes, cet article réutilise une branche de régression inspirée des Transformers, appelée Target Transformed Regression (TREG), afin d'améliorer le suivi sans ancres. Le cœur de notre TREG réside dans la modélisation des relations par paires entre les éléments du modèle cible et la région de recherche, et dans l'utilisation de la représentation visuelle améliorée ainsi obtenue pour une régression précise des boîtes englobantes. Cette représentation contextuelle du cible permet d'intensifier les informations pertinentes au sujet du cible, facilitant ainsi une localisation précise des limites de la boîte, tout en offrant une certaine résistance aux déformations de l'objet grâce à son mécanisme de correspondance locale et dense. En outre, nous proposons un mécanisme simple de mise à jour en ligne du modèle, permettant de sélectionner des modèles fiables, ce qui renforce la robustesse face aux variations d'apparence et aux déformations géométriques au fil du temps. Les résultats expérimentaux sur plusieurs benchmarks de suivi visuel — VOT2018, VOT2019, OTB100, GOT10k, NFS, UAV123, LaSOT et TrackingNet — montrent que TREG atteint des performances de pointe, avec un taux de succès de 0,640 sur LaSOT, tout en fonctionnant à environ 30 FPS. Le code source et les modèles seront rendus disponibles à l'adresse suivante : https://github.com/MCG-NJU/TREG.

Régression transformée cible pour un suivi précis | Articles de recherche récents | HyperAI