HyperAIHyperAI

Command Palette

Search for a command to run...

VideoGraph : Reconnaissance d'activités humaines de plusieurs minutes dans les vidéos

Noureddien Hussein Efstratios Gavves Arnold W.M. Smeulders

Résumé

De nombreuses activités humaines se déroulent sur une période de plusieurs minutes. Pour les représenter, les travaux connexes optent souvent pour des méthodes de regroupement statistique, qui négligent la structure temporelle. D'autres choisissent des méthodes de convolution, telles que les CNN (Convolutional Neural Networks) et les méthodes Non-Local. Bien qu'elles soient efficaces pour apprendre des concepts temporels, elles peinent à modéliser des dépendances temporelles s'étendant sur plusieurs minutes. Nous proposons VideoGraph, une méthode visant à combiner le meilleur des deux mondes : représenter des activités humaines s'étendant sur plusieurs minutes et apprendre leur structure temporelle sous-jacente. VideoGraph apprend une représentation basée sur un graphe pour les activités humaines. Le graphe, ses nœuds et ses arêtes sont entièrement appris à partir de jeux de données vidéo, ce qui rend VideoGraph applicable à des problèmes sans annotation au niveau des nœuds. Les résultats montrent des améliorations par rapport aux travaux connexes sur les bancs d'essai suivants : Epic-Kitchen et Breakfast. De plus, nous démontrons que VideoGraph est capable d'apprendre la structure temporelle des activités humaines dans des vidéos s'étendant sur plusieurs minutes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp