HyperAIHyperAI

Command Palette

Search for a command to run...

Wan2.2 : Un Modèle De Génération Vidéo À Grande Échelle Et De Haut Niveau Open Source

Date

il y a 6 mois

Size

1001.26 MB

License

Apache 2.0

Paper URL

2503.20314

1. Introduction au tutoriel

Construire

Wan-2.2 est un modèle avancé de génération vidéo par IA, open source et développé par le laboratoire Tongyi Wanxiang d'Alibaba depuis le 28 juillet 2025. Il comprend trois modèles open source : la vidéo basée sur du texte (Wan2.2-T2V-A14B), la vidéo basée sur des images (Wan2.2-I2V-A14B) et la génération vidéo unifiée (Wan2.2-IT2V-5B), totalisant 27 milliards de paramètres. Ce modèle est le premier à introduire une architecture hybride experte (MoE), améliorant ainsi la qualité de génération et l'efficacité de calcul. Il inaugure également un système de contrôle esthétique de niveau cinématographique, permettant de gérer avec précision des effets tels que l'éclairage, la couleur et la composition. Le tutoriel utilise le modèle compact de génération vidéo à 5 milliards de paramètres, compatible avec la génération vidéo basée sur du texte et des images, fonctionnant sur des cartes graphiques grand public et reposant sur une architecture VAE 3D haute performance. Il offre ainsi des taux de compression élevés et une génération vidéo haute définition rapide. Des articles de recherche associés sont disponibles. Wan : modèles génératifs vidéo à grande échelle ouverts et avancés .

Ce tutoriel utilise un seul GPU RTX A6000 comme ressource de calcul et déploie le modèle Wan2.2-IT2V-5B. Deux exemples, la génération de texte en vidéo et la génération d'image en vidéo, sont fournis à des fins de test.

2. Affichage des effets

Vidéo de génération de texte

Vidéo générée par l'image

3. Étapes de l'opération

1. Démarrez le conteneur

2. Étapes d'utilisation

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

1. Génération de texte en vidéo

Paramètres spécifiques :

  • Invite : le texte décrivant le contenu vidéo que vous souhaitez générer.
  • Durée : Spécifiez la durée de la vidéo souhaitée (en secondes).
  • Résolution de sortie : sélectionnez la résolution (largeur x hauteur) de la vidéo générée.
  • Étapes d'échantillonnage : contrôle le nombre d'optimisations itératives lors de la génération de la vidéo (le nombre d'étapes de débruitage pour le modèle de diffusion).
  • Échelle de guidage : contrôle la manière dont le modèle suit les mots d'invite de l'utilisateur.
  • Décalage d'échantillon : lié à l'échantillonneur utilisé, utilisé pour ajuster les paramètres du processus d'échantillonnage.
  • Seed : Contrôle le caractère aléatoire du processus de génération.

2. Génération d'image en vidéo

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@article{wan2025,
      title={Wan: Open and Advanced Large-Scale Video Generative Models}, 
      author={Team Wan and Ang Wang and Baole Ai and Bin Wen and Chaojie Mao and Chen-Wei Xie and Di Chen and Feiwu Yu and Haiming Zhao and Jianxiao Yang and Jianyuan Zeng and Jiayu Wang and Jingfeng Zhang and Jingren Zhou and Jinkai Wang and Jixuan Chen and Kai Zhu and Kang Zhao and Keyu Yan and Lianghua Huang and Mengyang Feng and Ningyi Zhang and Pandeng Li and Pingyu Wu and Ruihang Chu and Ruili Feng and Shiwei Zhang and Siyang Sun and Tao Fang and Tianxing Wang and Tianyi Gui and Tingyu Weng and Tong Shen and Wei Lin and Wei Wang and Wei Wang and Wenmeng Zhou and Wente Wang and Wenting Shen and Wenyuan Yu and Xianzhong Shi and Xiaoming Huang and Xin Xu and Yan Kou and Yangyu Lv and Yifei Li and Yijing Liu and Yiming Wang and Yingya Zhang and Yitong Huang and Yong Li and You Wu and Yu Liu and Yulin Pan and Yun Zheng and Yuntao Hong and Yupeng Shi and Yutong Feng and Zeyinzi Jiang and Zhen Han and Zhi-Fan Wu and Ziyu Liu},
      journal = {arXiv preprint arXiv:2503.20314},
      year={2025}
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp