Date

il y a 8 mois

Taille

510.31 MB

Balises

Multimodal

Génération De Vidéo

Licence

Apache 2.0

GitHub

Lightricks/LTX-Video

URL du document

2501.00103

1. Introduction au tutoriel

La version ltxv-13b-0.9.7-distilled de LTX-Video est le dernier modèle de distillation publié par Lightricks le 14 mai 2025. Ce modèle utilise les technologies de transformateur et Video-VAE pour générer efficacement des vidéos haute résolution. Sur un GPU Nvidia H100, il a généré une vidéo de 5 secondes à 24 images par seconde et à une résolution de 768 × 512 en seulement 2 secondes, surpassant ainsi tous les modèles existants de taille similaire. De plus, LTX-Video prend en charge diverses méthodes de génération vidéo, notamment la conversion de texte en vidéo, la conversion d'image en vidéo, la génération de vidéos étendues et la génération vidéo avec plusieurs conditions. Les résultats de la publication associée sont… LTX-Vidéo : diffusion latente vidéo en temps réel .

Ce didacticiel utilise une seule ressource informatique A6000 et fournit deux exemples de génération de texte en vidéo et d'image en vidéo à des fins de test.

2. Affichage des effets

Texte en vidéo :

Image à vidéo :

3. Étapes de l'opération

1. Démarrez le conteneur

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

2. Exemples d'utilisation

L'invite prend en charge l'anglais uniquement.

1. Image en vidéo

Paramètres spécifiques :

Télécharger une image : ici, vous pouvez télécharger une image comme point de départ pour la génération de vidéos.
Invite : vous pouvez saisir du texte pour décrire le contenu de la vidéo ici, et le modèle générera une vidéo basée sur ce texte.
Durée de la vidéo : sélectionnez la durée de la vidéo générée.
Invite négative : vous pouvez ici saisir des éléments ou des fonctionnalités que vous ne souhaitez pas voir apparaître dans la vidéo, ce qui permet d'éviter de générer des effets indésirables.
Graine : Ce nombre détermine le caractère aléatoire de la génération vidéo.
Échelle de guidage (CFG) : contrôle l’influence des invites sur la sortie. Des valeurs plus élevées ont un impact plus important.
Hauteur : hauteur, doit être divisible par 32.
Largeur : largeur, doit être divisible par 32.

résultat

2. Texte en vidéo

Paramètres spécifiques :

Invite : vous pouvez saisir du texte pour décrire le contenu de la vidéo ici, et le modèle générera une vidéo basée sur ce texte.
Durée de la vidéo : sélectionnez la durée de la vidéo générée.
Invite négative : vous pouvez ici saisir des éléments ou des fonctionnalités que vous ne souhaitez pas voir apparaître dans la vidéo, ce qui permet d'éviter de générer des effets indésirables.
Graine : Ce nombre détermine le caractère aléatoire de la génération vidéo.
Échelle de guidage (CFG) : contrôle l’influence des invites sur la sortie. Des valeurs plus élevées ont un impact plus important.
Hauteur : hauteur, doit être divisible par 32.
Largeur : largeur, doit être divisible par 32.

Résultat de sortie

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@article{HaCohen2024LTXVideo,
  title={LTX-Video: Realtime Video Latent Diffusion},
  author={HaCohen, Yoav and Chiprut, Nisan and Brazowski, Benny and Shalem, Daniel and Moshe, Dudu and Richardson, Eitan and Levin, Eran and Shiran, Guy and Zabari, Nir and Gordon, Ori and Panet, Poriya and Weissbuch, Sapir and Kulikov, Victor and Bitterman, Yaki and Melumian, Zeev and Bibi, Ofir},
  journal={arXiv preprint arXiv:2501.00103},
  year={2024}
}

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

VibeVoice - Synthèse Vocale En Temps Réel : Service De Synthèse Vocale En Temps Réel

il y a 2 mois

FLUX.2-dev : Modèle De Génération Et D’édition D’images

il y a 2 mois

Z-Image-Turbo : Un Modèle De Génération d'images À 6 paramètres Haute Efficacité

il y a 2 mois

Depth-Anything-3 : Restauration De L’espace Visuel Depuis N’importe Quelle Perspective

il y a 2 mois

Déploiement En Un Clic De Qwen-Image-Lightning

il y a 2 mois

Ovis-Image : Modèle De Génération d'images De Haute Qualité

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook

Date

il y a 8 mois

Taille

510.31 MB

Balises

Multimodal

Génération De Vidéo

Licence

Apache 2.0

GitHub

Lightricks/LTX-Video

URL du document

2501.00103

1. Introduction au tutoriel

Ce didacticiel utilise une seule ressource informatique A6000 et fournit deux exemples de génération de texte en vidéo et d'image en vidéo à des fins de test.