il y a 6 mois

Résumé

Depuis les réseaux de neurones récurrents (RNN) jusqu’aux réseaux de transformateurs visionnels (ViT), nous avons assisté à des progrès remarquables dans la prédiction vidéo, intégrant des entrées auxiliaires, des architectures neurales sophistiquées et des stratégies d’entraînement avancées. Si nous admirons ces avancées, nous sommes toutefois perplexes quant à leur nécessité : existe-t-il une méthode simple capable de produire des performances comparables ? Ce papier propose SimVP, un modèle de prédiction vidéo simple, entièrement basé sur des réseaux de neurones convolutifs (CNN) et entraîné de manière end-to-end via une perte MSE. Sans recourir à des astuces supplémentaires ni à des stratégies complexes, nous parvenons à atteindre des performances de pointe sur cinq jeux de données standard. À travers des expériences étendues, nous démontrons que SimVP possède une forte capacité de généralisation et d’extensibilité sur des jeux de données du monde réel. La réduction significative des coûts d’entraînement facilite sa mise à l’échelle dans des scénarios complexes. Nous pensons que SimVP peut servir de base solide pour stimuler le développement futur de la prédiction vidéo. Le code est disponible à l’adresse suivante : \href{https://github.com/gaozhangyang/SimVP-Simpler-yet-Better-Video-Prediction}{Github}.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Réseau De Neurones Convolutif

Apprentissage Profond

Compréhension Vidéo

Domaine De Recherche

Approche/Framework

Vision Par Ordinateur

Tâche

Zhangyang Gao Cheng Tan Lirong Wu Stan Z. Li

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Réseau De Neurones Convolutif

Apprentissage Profond

Compréhension Vidéo

Domaine De Recherche

Approche/Framework

Vision Par Ordinateur

Tâche

Zhangyang Gao Cheng Tan Lirong Wu Stan Z. Li

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

SimVP : Une Prédiction Vidéo Plus Simple Mais Plus Performante

Zhangyang Gao Cheng Tan Lirong Wu Stan Z. Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

SimVP : Une Prédiction Vidéo Plus Simple Mais Plus Performante

Zhangyang Gao Cheng Tan Lirong Wu Stan Z. Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

SimVP : Une Prédiction Vidéo Plus Simple Mais Plus Performante

Zhangyang Gao Cheng Tan Lirong Wu Stan Z. Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters