UCF101 : Une base de données de 101 classes d’actions humaines à partir de vidéos en conditions réelles

Nous présentons UCF101, qui est actuellement la plus grande base de données d'actions humaines. Elle comprend 101 classes d'actions, plus de 13 000 extraits et 27 heures de données vidéo. Cette base de données est constituée de vidéos réalistes téléchargées par des utilisateurs, contenant des mouvements de caméra et des arrière-plans encombrés. De plus, nous fournissons des résultats de reconnaissance d'actions de référence sur ce nouveau jeu de données en utilisant une approche standard basée sur le sac de mots (bag of words), avec une performance globale de 44,5 %. Selon nos connaissances, UCF101 est actuellement le jeu de données le plus difficile dans le domaine des actions en raison du grand nombre de classes, du grand nombre d'extraits et également de la nature non contrainte de ces extraits.