HyperAIHyperAI

Command Palette

Search for a command to run...

AssembleNet : Recherche de connexions neuronales multi-flux dans les architectures vidéo

Michael S. Ryoo AJ Piergiovanni Mingxing Tan Anelia Angelova

Résumé

L'apprentissage de la représentation des vidéos est une tâche très complexe tant sur le plan algorithmique que computationnel. Les architectures standard de CNN pour vidéo ont été conçues en étendant directement les architectures élaborées pour la compréhension des images afin d'inclure la dimension temporelle, en utilisant des modules tels que les convolutions 3D, ou en adoptant un design à deux flux pour capturer à la fois l'apparence et le mouvement dans les vidéos. Nous interprétons une CNN pour vidéo comme une collection de blocs convolutionnels multi-flux connectés entre eux, et proposons une approche consistant à trouver automatiquement des architectures neuronales avec une meilleure connectivité et des interactions spatio-temporelles améliorées pour la compréhension des vidéos. Cela est réalisé en faisant évoluer une population d'architectures sur-connectées guidée par l'apprentissage des poids de connexion. Nous recherchons des architectures combinant des représentations qui abstraient différents types d'entrée (c'est-à-dire RGB et flux optique) à plusieurs résolutions temporelles, permettant ainsi aux différentes informations ou sources de se combiner mutuellement. Notre méthode, dénommée AssembleNet, surpassent les approches précédentes sur des jeux de données vidéo publics, parfois avec une marge considérable. Nous obtenons un mAP de 58,6% sur Charades et une précision de 34,27% sur Moments-in-Time.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp