HyperAIHyperAI

Command Palette

Search for a command to run...

Trouver des Tubes d'Action

Georgia Gkioxari; Jitendra Malik

Résumé

Nous abordons le problème de la détection d'actions dans les vidéos. Guidés par les derniers progrès en matière de détection d'objets à partir d'images 2D, nous construisons des modèles d'action en utilisant des hiérarchies de caractéristiques riches issues des indices de forme et cinématiques. Nous intégrons l'apparence et le mouvement de deux manières. Premièrement, partant des propositions de régions d'image, nous sélectionnons celles qui sont salientes en termes de mouvement et qui ont donc plus de chances de contenir l'action. Cela entraîne une réduction significative du nombre de régions traitées et permet des calculs plus rapides. Deuxièmement, nous extrayons des représentations de caractéristiques spatio-temporelles pour construire des classifieurs robustes à l'aide de Réseaux Neuronaux Convolutifs (Convolutional Neural Networks). Nous relions nos prédictions pour produire des détections cohérentes dans le temps, que nous appelons tubes d'action. Nous montrons que notre approche surpasse les autres techniques dans la tâche de détection d'actions.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp