HyperAIHyperAI
il y a 2 mois

Les objets ne disparaissent pas : Détection d'objets vidéo par anticipation de la localisation mono-image

Xin Liu; Fatemeh Karimi Nejadasl; Jan C. van Gemert; Olaf Booij; Silvia L. Pintea
Les objets ne disparaissent pas : Détection d'objets vidéo par anticipation de la localisation mono-image
Résumé

Les objets dans les vidéos sont généralement caractérisés par un mouvement continu et fluide. Nous exploitons ce mouvement continu et fluide de trois manières. 1) Amélioration de la précision en utilisant le mouvement des objets comme source supplémentaire de supervision, que nous obtenons en anticipant les positions des objets à partir d'une image clé statique. 2) Amélioration de l'efficacité en ne réalisant les calculs coûteux de caractéristiques que sur un petit sous-ensemble de tous les cadres. Étant donné que les cadres vidéo voisins sont souvent redondants, nous ne calculons les caractéristiques que pour une seule image clé statique et prédisons les positions des objets dans les cadres suivants. 3) Réduction du coût d'annotation, où nous n'annotons que l'image clé et utilisons un mouvement pseudo-fluide entre les images clés. Nous démontrons l'efficacité computationnelle, l'efficacité d'annotation et une précision moyenne améliorée par rapport à l'état de l'art sur quatre jeux de données : ImageNet VID, EPIC KITCHENS-55, YouTube-BoundingBoxes et Waymo Open dataset. Notre code source est disponible à l'adresse https://github.com/L-KID/Videoobject-detection-by-location-anticipation.

Les objets ne disparaissent pas : Détection d'objets vidéo par anticipation de la localisation mono-image | Articles de recherche récents | HyperAI