HyperAIHyperAI

Command Palette

Search for a command to run...

AZTR : Reconnaissance d'actions dans des vidéos aériennes avec zoom automatique et raisonnement temporel

Xijun Wang Ruiqi Xian Tianrui Guan Celso M. de Melo Stephen M. Nogar Aniket Bera Dinesh Manocha

Résumé

Nous proposons une nouvelle approche pour la reconnaissance d’actions dans les vidéos aériennes. Notre méthode est conçue pour les vidéos capturées par des UAVs et peut fonctionner sur des dispositifs embarqués ou mobiles. Nous présentons une approche fondée sur l’apprentissage qui utilise un zoom automatique personnalisé pour détecter automatiquement la cible humaine et la mettre à l’échelle de manière appropriée. Cela facilite l’extraction des caractéristiques clés tout en réduisant la charge computationnelle. Nous introduisons également un algorithme efficace de raisonnement temporel permettant de capturer les informations d’action dans les domaines spatial et temporel, avec un coût computationnel contrôlable. Notre approche a été implémentée et évaluée aussi bien sur un poste de travail équipé de GPU haut de gamme que sur la plateforme robotique à faible consommation Robotics RB5, destinée aux robots et drones. En pratique, nous obtenons une amélioration de 6,1 à 7,4 % en précision Top-1 par rapport aux méthodes de l’état de l’art sur le jeu de données RoCoG-v2, une amélioration de 8,3 à 10,4 % sur le jeu de données UAV-Human, et une amélioration de 3,2 % sur le jeu de données Drone Action.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp