HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux Multi-Fibres pour la Reconnaissance Vidéo

Yunpeng Chen; Yannis Kalantidis; Jianshu Li; Shuicheng Yan; Jiashi Feng

Résumé

Dans cet article, nous visons à réduire le coût computationnel des réseaux neuronaux profonds spatio-temporels, afin qu'ils puissent fonctionner aussi rapidement que leurs homologues 2D tout en conservant une précision de pointe sur les benchmarks de reconnaissance vidéo. À cette fin, nous présentons l'architecture Multi-Fiber innovante qui divise un réseau neuronal complexe en un ensemble de réseaux légers ou fibres qui traversent le réseau. Pour faciliter le flux d'information entre les fibres, nous intégrons également des modules multiplexeurs, aboutissant ainsi à une architecture qui réduit le coût computationnel des réseaux 3D d'un ordre de grandeur tout en améliorant simultanément les performances de reconnaissance. Des résultats expérimentaux approfondis montrent que notre architecture Multi-Fiber augmente considérablement l'efficacité des réseaux de convolution existants pour les tâches de reconnaissance d'images et de vidéos, atteignant des performances de pointe sur les jeux de données UCF-101, HMDB-51 et Kinetics. Notre modèle proposé nécessite plus de 9 fois et 13 fois moins de calculs que les modèles I3D et R(2+1)D respectivement, tout en offrant une meilleure précision.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp