HyperAI

TransPixeler : Texte En Vidéo RGBA

1. Introduction au tutoriel

Construire

TransPixeler est une méthode de génération de texte en vidéo publiée par l'Université chinoise de Hong Kong, l'Université des sciences et technologies de Hong Kong et Adobe Research en 2025. Cette méthode conserve les avantages du modèle RVB d'origine et permet un alignement fort entre les canaux RVB et alpha avec des données d'entraînement limitées. Il peut générer efficacement des vidéos RGBA diverses et cohérentes, favorisant ainsi la possibilité d'effets visuels et de création de contenu interactif. Les résultats pertinents de l'article sontTransPixeler : conversion de texte en vidéo optimisée grâce à la transparence", a été CVPR 2025 accepter.

Ce didacticiel utilise une ressource A6000 à carte unique et la description textuelle ne prend actuellement en charge que l'anglais.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.

2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle

Description des paramètres :

  • Graine:  Graine de nombre aléatoire, utilisée pour contrôler le caractère aléatoire du processus de génération. La même valeur Seed peut produire les mêmes résultats (à condition que les autres paramètres soient les mêmes), ce qui est très important pour reproduire les résultats.

Comment utiliser

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Merci à l'utilisateur Github xxxjjjyyy1  Déploiement de ce tutoriel. Les informations de citation pour ce projet sont les suivantes :

@misc{wang2025transpixeler,
      title={TransPixeler: Advancing Text-to-Video Generation with Transparency}, 
      author={Luozhou Wang and Yijun Li and Zhifei Chen and Jui-Hsien Wang and Zhifei Zhang and He Zhang and Zhe Lin and Ying-Cong Chen},
      year={2025},
      eprint={2501.03006},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2501.03006}, 
}