HyperAIHyperAI

Command Palette

Search for a command to run...

Réseau de Caractéristiques de Mouvement : Filtre de Mouvement Fixe pour la Reconnaissance d'Actions

Myunggi Lee; Seungeui Lee; Sungjoon Son; Gyutae Park; Nojun Kwak

Résumé

Les représentations spatio-temporelles dans les séquences d'images jouent un rôle important dans la tâche de reconnaissance d'actions. Précédemment, une méthode consistant à utiliser le flux optique comme information temporelle en combinaison avec un ensemble d'images RGB contenant des informations spatiales a montré une amélioration considérable des performances dans les tâches de reconnaissance d'actions. Cependant, cette méthode présente un coût computationnel élevé et nécessite un cadre à deux flux (RGB et flux optique). Dans cet article, nous proposons MFNet (Motion Feature Network), qui intègre des blocs de mouvement permettant d'encoder les informations spatio-temporelles entre les images adjacentes au sein d'un réseau unifié pouvant être entraîné de manière end-to-end. Les blocs de mouvement peuvent être ajoutés à n'importe quel cadre existant basé sur les CNN pour la reconnaissance d'actions, avec seulement un coût supplémentaire minime. Nous avons évalué notre réseau sur deux ensembles de données de reconnaissance d'actions (Jester et Something-Something) et avons obtenu des performances compétitives pour les deux ensembles en entraînant les réseaux à partir de zéro.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Réseau de Caractéristiques de Mouvement : Filtre de Mouvement Fixe pour la Reconnaissance d'Actions | Articles | HyperAI