Modèle autoregressif empilé implicite pour la prédiction vidéo

La prédiction des cadres futurs a été abordée principalement selon deux approches : les méthodes autoregressives et les méthodes non autoregressives. Les méthodes autoregressives reposent sur l'hypothèse de Markov et permettent d'obtenir une précision élevée dans les premières étapes de la prédiction, lorsque les erreurs ne sont pas encore accumulées. Toutefois, leur performance tend à décliner avec l'augmentation du nombre d'étapes temporelles. En revanche, les méthodes non autoregressives peuvent atteindre une performance relativement élevée, mais elles manquent de corrélation entre les prédictions effectuées pour chaque étape temporelle. Dans ce travail, nous proposons un modèle autoregressif empilé implicite pour la prédiction vidéo (IAM4VP), un modèle implicite de prédiction vidéo qui applique une méthode autoregressive empilée. À l’instar des méthodes non autoregressives, les méthodes autoregressives empilées utilisent le même cadre observé pour estimer tous les cadres futurs. Toutefois, elles utilisent leurs propres prédictions comme entrée, de manière similaire aux méthodes autoregressives. À mesure que le nombre d’étapes temporelles augmente, les prédictions sont empilées séquentiellement dans une file d’attente. Pour évaluer l’efficacité de IAM4VP, nous avons mené des expériences sur trois jeux de données standards pour la prédiction des cadres futurs ainsi que sur des jeux de données standards pour la prédiction météorologique et climatique. Les résultats démontrent que le modèle proposé atteint une performance de pointe par rapport aux états de l’art.