il y a 6 mois

Résumé

Les réseaux de neurones convolutifs (CNN) se sont imposés comme une classe puissante de modèles pour les problèmes de reconnaissance d’images. Encouragés par ces résultats, nous menons une évaluation empirique approfondie des CNN sur la classification vidéo à grande échelle, en utilisant un nouveau jeu de données composé de 1 million de vidéos YouTube réparties en 487 catégories. Nous examinons plusieurs approches visant à étendre la connectivité d’un CNN dans le domaine temporel afin d’exploiter efficacement les informations spatio-temporelles locales, et proposons une architecture multirésolution à vision foveale comme une voie prometteuse pour accélérer l’entraînement. Nos meilleurs réseaux spatio-temporels montrent une amélioration significative par rapport à des bases fortes basées sur des caractéristiques (passant de 55,3 % à 63,9 %), mais une amélioration surprenante et modeste comparée aux modèles à image unique (passant de 59,3 % à 60,9 %). Nous étudions également la capacité de généralisation de notre meilleur modèle en réentraînant les couches supérieures sur le jeu de données UCF-101 pour la reconnaissance d’actions, observant alors une amélioration notable par rapport au modèle de référence UCF-101 (63,3 % contre 43,9 %).

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Compréhension Vidéo

Réseau De Neurones Convolutif

Reconnaissance D'action

Approche/Framework

Vision Par Ordinateur

Tâche

Li Fei-Fei Rahul Sukthankar Thomas Leung George Toderici Sanketh Shetty Andrej Karpathy

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Compréhension Vidéo

Réseau De Neurones Convolutif

Reconnaissance D'action

Approche/Framework

Vision Par Ordinateur

Tâche

Li Fei-Fei Rahul Sukthankar Thomas Leung George Toderici Sanketh Shetty Andrej Karpathy

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Classification vidéo à grande échelle avec des réseaux de neurones convolutifs

Li Fei-Fei Rahul Sukthankar Thomas Leung George Toderici Sanketh Shetty Andrej Karpathy

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Classification vidéo à grande échelle avec des réseaux de neurones convolutifs

Li Fei-Fei Rahul Sukthankar Thomas Leung George Toderici Sanketh Shetty Andrej Karpathy

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Classification vidéo à grande échelle avec des réseaux de neurones convolutifs

Li Fei-Fei Rahul Sukthankar Thomas Leung George Toderici Sanketh Shetty Andrej Karpathy

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters