HyperAIHyperAI

Command Palette

Search for a command to run...

Attentionnel Pooling pour la Reconnaissance d'Actions

Rohit Girdhar Deva Ramanan

Résumé

Nous présentons un modèle simple mais surprenamment puissant pour intégrer l'attention dans les tâches de reconnaissance d'actions et d'interaction entre humains et objets. Le module d'attention que nous proposons peut être entraîné avec ou sans supervision supplémentaire, offrant une augmentation notable de la précision tout en maintenant pratiquement inchangées la taille du réseau et le coût computationnel. Il permet des améliorations significatives par rapport aux architectures de pointe actuelles sur trois benchmarks standards de reconnaissance d'actions, tant pour les images fixes que pour les vidéos, et établit un nouveau record sur le jeu de données MPII avec une amélioration relative de 12,5 %. Nous effectuons également une analyse approfondie de notre module d'attention, à la fois empirique et analytique. Dans ce dernier cas, nous introduisons une nouvelle dérivation de l'attention ascendante (bottom-up) et descendante (top-down) comme des approximations de rang faible des méthodes de poolage bilinéaire (généralement utilisées pour la classification fine). De cette perspective, notre formulation de l'attention suggère une nouvelle caractérisation de la reconnaissance d'actions en tant que problème de reconnaissance fine-grained.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp