HyperAIHyperAI
il y a 2 mois

Flux de Caractéristiques Profondes pour la Reconnaissance Vidéo

Xizhou Zhu; Yuwen Xiong; Jifeng Dai; Lu Yuan; Yichen Wei
Flux de Caractéristiques Profondes pour la Reconnaissance Vidéo
Résumé

Les réseaux de neurones convolutifs profonds ont connu un grand succès dans les tâches de reconnaissance d'images. Cependant, il n'est pas trivial de transférer les réseaux de pointe en reconnaissance d'images aux vidéos, car l'évaluation frame par frame est trop lente et coûteuse. Nous présentons le flux de caractéristiques profondes (deep feature flow), un cadre rapide et précis pour la reconnaissance vidéo. Ce cadre exécute le sous-réseau convolutif coûteux uniquement sur des images clés espacées et propage leurs cartes de caractéristiques profondes aux autres frames via un champ de flux. Il permet une accélération significative, car le calcul du flux est relativement rapide. L'entraînement end-to-end de toute l'architecture améliore considérablement la précision de la reconnaissance. Le flux de caractéristiques profondes est flexible et général. Il a été validé sur deux jeux de données vidéo à grande échelle récents. Il représente une avancée importante vers une reconnaissance vidéo pratique.

Flux de Caractéristiques Profondes pour la Reconnaissance Vidéo | Articles de recherche récents | HyperAI