il y a 6 mois

Résumé

Récemment, la représentation neuronale implicite par image pour les vidéos, dénommée NeRV, a connu une popularité croissante en raison de ses résultats prometteurs et de sa rapidité supérieure par rapport aux représentations implicites classiques par pixel. Toutefois, les paramètres redondants présents dans la structure du réseau peuvent entraîner une taille de modèle importante lorsqu’on cherche à améliorer les performances. La cause principale de ce phénomène réside dans la formulation couplée de NeRV, qui extrait directement les informations spatiales et temporelles des trames vidéo à partir de l’indice de trame en entrée. Dans cet article, nous proposons E-NeRV, une méthode qui accélère considérablement NeRV en décomposant la représentation neuronale implicite par image en contextes spatiaux et temporels séparés. Grâce à cette nouvelle formulation, notre modèle réduit fortement les paramètres redondants tout en préservant une capacité de représentation efficace. Nos expérimentations montrent que notre approche améliore significativement les performances avec un nombre réduit de paramètres, conduisant à une accélération supérieure à 8× en vitesse de convergence. Le code est disponible à l’adresse suivante : https://github.com/kyleleey/E-NeRV.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Vision Par Ordinateur

Traitement Vidéo

Image Vers Vidéo

Multimodal

Vision Par Ordinateur

Tâche

Zizhang Li Mengmeng Wang Huaijin Pi Kechun Xu Jianbiao Mei Yong Liu

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Vision Par Ordinateur

Traitement Vidéo

Image Vers Vidéo

Multimodal

Vision Par Ordinateur

Tâche

Zizhang Li Mengmeng Wang Huaijin Pi Kechun Xu Jianbiao Mei Yong Liu

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

E-NeRV : Accélérer la représentation vidéo neuronale grâce au contexte spatial-temporel désentrelacé | Articles | HyperAI

Command Palette

E-NeRV : Accélérer la représentation vidéo neuronale grâce au contexte spatial-temporel désentrelacé

Zizhang Li Mengmeng Wang Huaijin Pi Kechun Xu Jianbiao Mei Yong Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

E-NeRV : Accélérer la représentation vidéo neuronale grâce au contexte spatial-temporel désentrelacé

Zizhang Li Mengmeng Wang Huaijin Pi Kechun Xu Jianbiao Mei Yong Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

E-NeRV : Accélérer la représentation vidéo neuronale grâce au contexte spatial-temporel désentrelacé

Zizhang Li Mengmeng Wang Huaijin Pi Kechun Xu Jianbiao Mei Yong Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters