HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage de caractéristiques spatio-temporelles avec des réseaux de neurones convolutionnels 3D

Du Tran Lubomir Bourdev Rob Fergus Lorenzo Torresani Manohar Paluri

Résumé

Nous proposons une approche simple, mais efficace pour l'apprentissage de caractéristiques spatio-temporelles à l'aide de réseaux de neurones convolutifs tridimensionnels profonds (3D ConvNets) formés sur un grand ensemble de données vidéo supervisées. Nos résultats sont triples : 1) les 3D ConvNets sont plus adaptés à l'apprentissage de caractéristiques spatio-temporelles par rapport aux 2D ConvNets ; 2) une architecture homogène avec des noyaux de convolution de petite taille (3x3x3) dans toutes les couches est parmi les meilleures architectures pour les 3D ConvNets ; et 3) nos caractéristiques apprises, appelées C3D (Convolutional 3D), associées à un classifieur linéaire simple, surpassent les méthodes d'avant-garde sur quatre différents benchmarks et sont comparables aux meilleures méthodes actuelles sur les deux autres benchmarks. De plus, ces caractéristiques sont compactes : elles atteignent une précision de 52,8 % sur le jeu de données UCF101 avec seulement 10 dimensions, et leur calcul est très efficace grâce à l'inférence rapide des ConvNets. Enfin, elles sont conceptuellement très simples et faciles à former et à utiliser.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp