HyperAIHyperAI

Command Palette

Search for a command to run...

R-CNN à deux flux multi-régions pour la détection d'actions

Cordelia Schmid Xiaojiang Peng

Résumé

Nous proposons un modèle R-CNN à deux flux multi-régions pour la détection d’actions dans des vidéos réalistes. Nous partons d’une détection d’actions au niveau des trames basée sur Faster R-CNN [1], et apportons trois contributions principales : (1) nous montrons qu’un réseau de propositions de régions motionnelles génère des propositions de haute qualité, complémentaires à celles produites par un réseau de propositions de régions d’apparence ; (2) nous démontrons qu’empiler les flux optiques sur plusieurs trames améliore significativement la détection d’actions au niveau des trames ; (3) nous intégrons une stratégie multi-régions dans le modèle Faster R-CNN, ajoutant ainsi des informations complémentaires sur les parties du corps. Nous relions ensuite les détections au niveau des trames à l’aide de l’algorithme de Viterbi, et localisons temporellement les actions à l’aide de la méthode du sous-tableau maximal. Les résultats expérimentaux sur les jeux de données de détection d’actions UCF-Sports, J-HMDB et UCF101 montrent que notre approche surpasse de manière significative l’état de l’art, tant en termes de frame-mAP que de video-mAP.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
R-CNN à deux flux multi-régions pour la détection d'actions | Articles | HyperAI