HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 3 mois

FIFO-Diffusion : Génération de vidéos infinies à partir de texte sans entraînement

Jihwan Kim Junoh Kang Jinyoung Choi Bohyung Han

FIFO-Diffusion : Génération de vidéos infinies à partir de texte sans entraînement

Résumé

Nous proposons une nouvelle technique d'inférence fondée sur un modèle de diffusion préentraîné pour la génération vidéo conditionnée par le texte. Notre approche, nommée FIFO-Diffusion, est conceptuellement capable de générer des vidéos de longueur infinie sans nécessiter d'entraînement. Cela est réalisé en effectuant itérativement une débruitage diagonal, qui traite simultanément une série de trames consécutives avec des niveaux de bruit croissants dans une file d'attente : notre méthode défile une trame entièrement débruitée en tête tout en ajoutant une nouvelle trame aléatoire bruitée en queue. Toutefois, le débruitage diagonal constitue un outil à double tranchant, car les trames proches de la queue peuvent tirer parti des trames plus propres grâce à une référence en avant (forward referencing), mais cette stratégie engendre un écart entre l'entraînement et l'inférence. Afin de réduire cet écart, nous introduisons une partition latente, et pour tirer parti des avantages de la référence en avant, nous proposons un débruitage anticipé (lookahead denoising). Nous avons démontré les résultats prometteurs et l'efficacité de ces méthodes proposées sur les modèles de référence existants en génération vidéo conditionnée par le texte.

Dépôts de code

jjihwan/FIFO-Diffusion_public
Officiel
pytorch
Mentionné dans GitHub

Benchmarks

BenchmarkMéthodologieMétriques
video-generation-on-ucf-101FIFO-Diffusion
FVD128: 596.64
Inception Score: 74.44

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
FIFO-Diffusion : Génération de vidéos infinies à partir de texte sans entraînement | Articles de recherche | HyperAI