HyperAIHyperAI
il y a 17 jours

AZTR : Reconnaissance d'actions dans des vidéos aériennes avec zoom automatique et raisonnement temporel

Xijun Wang, Ruiqi Xian, Tianrui Guan, Celso M. de Melo, Stephen M. Nogar, Aniket Bera, Dinesh Manocha
AZTR : Reconnaissance d'actions dans des vidéos aériennes avec zoom automatique et raisonnement temporel
Résumé

Nous proposons une nouvelle approche pour la reconnaissance d’actions dans les vidéos aériennes. Notre méthode est conçue pour les vidéos capturées par des UAVs et peut fonctionner sur des dispositifs embarqués ou mobiles. Nous présentons une approche fondée sur l’apprentissage qui utilise un zoom automatique personnalisé pour détecter automatiquement la cible humaine et la mettre à l’échelle de manière appropriée. Cela facilite l’extraction des caractéristiques clés tout en réduisant la charge computationnelle. Nous introduisons également un algorithme efficace de raisonnement temporel permettant de capturer les informations d’action dans les domaines spatial et temporel, avec un coût computationnel contrôlable. Notre approche a été implémentée et évaluée aussi bien sur un poste de travail équipé de GPU haut de gamme que sur la plateforme robotique à faible consommation Robotics RB5, destinée aux robots et drones. En pratique, nous obtenons une amélioration de 6,1 à 7,4 % en précision Top-1 par rapport aux méthodes de l’état de l’art sur le jeu de données RoCoG-v2, une amélioration de 8,3 à 10,4 % sur le jeu de données UAV-Human, et une amélioration de 3,2 % sur le jeu de données Drone Action.

AZTR : Reconnaissance d'actions dans des vidéos aériennes avec zoom automatique et raisonnement temporel | Articles de recherche récents | HyperAI