HyperAIHyperAI

Command Palette

Search for a command to run...

ST-MFNet : Un réseau multi-flux spatio-temporel pour l'interpolation de trames

Duolikun Danier Fan Zhang David Bull

Résumé

L’interpolation de trames vidéo (VFI) est actuellement un domaine de recherche très actif, avec des applications s’étendant du traitement d’images, à la post-production et au codage vidéo. Cette tâche peut s’avérer extrêmement difficile, notamment dans les séquences présentant de grands mouvements, des occlusions ou des textures dynamiques, où les approches existantes échouent à offrir une performance d’interpolation perceptuellement robuste. Dans ce contexte, nous proposons une nouvelle méthode de VFI basée sur l’apprentissage profond, nommée ST-MFNet, fondée sur une architecture Spatio-Temporelle à Multi-Flux. ST-MFNet utilise un nouveau prédicteur multi-échelle à multi-flux pour estimer des flux intermédiaires de type « plusieurs vers un », qui sont combinés aux flux optiques classiques « un vers un » afin de capturer à la fois les grands mouvements et les mouvements complexes. Afin d’améliorer la performance d’interpolation pour divers types de textures, un réseau de neurones convolutif 3D (3D CNN) est également employé pour modéliser les dynamiques du contenu sur une fenêtre temporelle étendue. En outre, ST-MFNet a été entraîné dans un cadre ST-GAN, initialement développé pour la synthèse de textures, dans le but d’optimiser davantage la qualité perceptuelle de l’interpolation. Notre approche a été évaluée de manière exhaustive, en comparaison avec quatorze algorithmes de pointe en VFI, démontrant clairement que ST-MFNet surpasse de manière cohérente ces références sur des jeux de données variés et représentatifs, avec des gains significatifs atteignant jusqu’à 1,09 dB en PSNR dans des cas incluant de grands mouvements et des textures dynamiques. Page du projet : https://danielism97.github.io/ST-MFNet.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp