HyperAIHyperAI

Command Palette

Search for a command to run...

VideoCrafter1 : Modèles de diffusion ouverts pour la génération de vidéos de haute qualité

Résumé

La génération vidéo a suscité un intérêt croissant tant dans le milieu académique que dans l’industrie. Bien que des outils commerciaux soient capables de produire des vidéos crédibles, le nombre de modèles open-source disponibles pour les chercheurs et ingénieurs reste limité. Dans ce travail, nous introduisons deux modèles à diffusion pour la génération de vidéos de haute qualité : des modèles texte-vers-vidéo (T2V) et des modèles image-vers-vidéo (I2V). Les modèles T2V synthétisent une vidéo à partir d’une entrée textuelle donnée, tandis que les modèles I2V intègrent en outre une entrée image. Notre modèle T2V proposé permet de générer des vidéos réalistes et de qualité cinématographique à une résolution de 1024×5761024 \times 5761024×576, surpassant ainsi d’autres modèles open-source T2V en termes de qualité. Le modèle I2V est conçu pour produire des vidéos qui respectent strictement le contenu de l’image de référence fournie, en préservant fidèlement son contenu, sa structure et son style. Ce modèle constitue le premier modèle fondamental open-source I2V capable de transformer une image donnée en une séquence vidéo tout en respectant des contraintes de préservation du contenu. Nous estimons que ces modèles open-source de génération vidéo contribueront de manière significative aux progrès technologiques au sein de la communauté.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp