HyperAIHyperAI

Command Palette

Search for a command to run...

Tout moment compte : Étiquetage dense et détaillé des actions dans des vidéos complexes

Serena Yeung Olga Russakovsky Ning Jin Mykhaylo Andriluka Greg Mori Li Fei-Fei

Résumé

Chaque instant compte dans la reconnaissance d'actions. Une compréhension exhaustive des activités humaines dans les vidéos nécessite d'étiqueter chaque image en fonction des actions qui s'y déroulent, en plaçant plusieurs étiquettes de manière dense sur une séquence vidéo. Pour étudier ce problème, nous avons étendu le jeu de données existant THUMOS et introduit MultiTHUMOS, un nouveau jeu de données comprenant des étiquettes denses sur des vidéos internet non contraintes. La modélisation de multiples étiquettes denses bénéficie des relations temporelles intra- et inter-classes. Nous définissons une nouvelle variante de réseaux profonds à mémoire à court et long terme (LSTM) pour modéliser ces relations temporelles par le biais de connexions multiples en entrée et en sortie. Nous montrons que ce modèle améliore la précision de l'étiquetage des actions et permet également d'aborder des tâches de compréhension plus approfondie, allant de la recherche structurée à la prédiction des actions.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Tout moment compte : Étiquetage dense et détaillé des actions dans des vidéos complexes | Articles | HyperAI