Exécuter ce Notebook Discuter sur Discord

Date

il y a 8 mois

Taille

3.28 GB

Balises

ComfyUI

Génération De Vidéo

GitHub

Tencent-Hunyuan/HunyuanCustom

URL du document

2505.04512

1. Introduction au tutoriel

Ce tutoriel utilise une seule carte RTX 4090 comme ressource, et la génération vidéo prend environ 10 minutes. Il est recommandé d'utiliser un GPU avec 80 Go de mémoire pour une meilleure qualité de génération.

HunyuanCustom, développé par l'équipe Hunyuan de Tencent et lancé le 9 mai 2025, est un framework de génération vidéo multimodal et personnalisable. Ce modèle génératif multimodal et conditionnellement contrôlable repose sur le framework de génération vidéo Hunyuan et est axé sur la cohérence thématique. Il permet de générer des vidéos thématiquement cohérentes à partir de textes, d'images, d'audio et de vidéos. Grâce aux capacités multimodales de HunyuanCustom, de nombreuses applications peuvent être réalisées. Par exemple, en intégrant plusieurs images, HunyuanCustom peut faciliter la publicité avec des avatars et les essayages de maquillage virtuels. Des articles de recherche associés sont disponibles. HunyuanCustom : une architecture multimodale pour la génération de vidéos personnalisées .

Ce didacticiel de flux de travail utilise au total les fichiers modèles suivants :

hunyuan_video_custom_720p_fp8_scaled.safetensors
llava_llama3_fp16.safetensors
hunyuan_video_vae_bf16.safetensors
clip_l.safetensors

2. Exemples de projets

Personnalisation vidéo multimodale

Diverses applications

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

2. Démonstration fonctionnelle

Comment utiliser

Le premier clone nécessite l'importation manuelle du fichier de workflow pour le chargement

Vidéo de génération d'images

Sélectionnez une image

Invite de saisie

Résultat de sortie

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@misc{hu2025hunyuancustom,
      title={HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation}, 
      author={Teng Hu and Zhentao Yu and Zhengguang Zhou and Sen Liang and Yuan Zhou and Qin Lin and Qinglin Lu},
      year={2025},
      eprint={2505.04512},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2505.04512}, 
}

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI