HyperAIHyperAI

Command Palette

Search for a command to run...

DAFA : Agrégation de caractéristiques consciente de la diversité pour la détection d'objets vidéo basée sur l'attention

Ki-Seok Chung Si-Dong Roh

Résumé

Nous présentons un cadre pour la détection d'objets vidéo basée sur l'attention, fondé sur un algorithme simple mais efficace de gestion de mémoire externe. Une mécanisme d'attention a été adopté dans la tâche de détection d'objets vidéo afin d'enrichir les caractéristiques des images-clés à l'aide des images adjacentes. Bien que plusieurs études récentes aient utilisé une mémoire de type first-in-first-out (FIFO) au niveau des images pour capturer des informations globales de la vidéo, cette structure de mémoire souffre d'une inefficacité dans la collecte des données, entraînant une faible performance d'attention et un coût computationnel élevé. Pour résoudre ce problème, nous avons développé une nouvelle approche appelée agrégation de caractéristiques consciente de la diversité (DAFA). Contrairement à d'autres méthodes qui ne stockent pas suffisamment d'informations caractéristiques sans augmenter la capacité de mémoire, DAFA collecte efficacement des caractéristiques diversifiées tout en évitant les redondances grâce à une métrique simple basée sur la distance euclidienne. Les résultats expérimentaux sur le jeu de données ImageNet VID montrent que notre modèle léger intégrant une attention globale atteint un score de 83,5 mAP sur le modèle de base ResNet-101, dépassant ainsi les performances de la plupart des méthodes existantes avec un temps d'exécution minimal. Notre méthode combinant des étapes d'attention globale et locale obtient respectivement 84,5 et 85,9 mAP sur ResNet-101 et ResNeXt-101, atteignant ainsi un niveau d'état de l'art sans nécessiter de méthodes de post-traitement supplémentaires.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DAFA : Agrégation de caractéristiques consciente de la diversité pour la détection d'objets vidéo basée sur l'attention | Articles | HyperAI