LTX-Video 13B : Une Révolution en Vidéo Générée par IA avec 30x la Vitesse et une Qualité Inégalée
L LIGHTRICKS lance LTX-Video 13B : une avancée majeure dans la génération de vidéos grâce à l’IA La technologie de génération vidéo par intelligence artificielle (IA) fait une nouvelle percée significative ! La semaine dernière, Lightricks a introduit LTX-Video 13B, son dernier modèle open source de génération vidéo. Grâce à ses 13 milliards de paramètres, sa vitesse de génération 30 fois plus rapide que les modèles concurrents, et son approche innovante de rendu multi-échelles, ce modèle est devenu rapidement un point focal dans l'industrie. Innovationtechnique : le rendu multi-échelles revisite la génération de vidéos LTX-Video 13B adopte une méthode unique de rendu multi-échelles. Cette technique permet au modèle de d'abord créer une version basse résolution du mouvement global et de la disposition des scènes, avant de progressivement affiner les détails. Cette approche non seulement accélère la génération, mais assure également une meilleure qualité d'image. Le modèle est capable de produire 5 secondes de vidéo en seulement 2 secondes, sans compromettre la qualité. Il s’exécute également de manière fluide sur des GPU grand public comme la NVIDIA RTX 4090, offrant une expérience performante même aux utilisateurs disposant d’équipements modestes. Basé sur l'architecture DiT (Diffusion Transformer), LTX-Video 13B bénéficie de noyaux avancés et d'une optimisation des données en bfloat16, ce qui renforce encore sa performance. La résolution supportée est de 1216x704 pixels, avec une fréquence cadencée à 30 images par seconde, compatible avec divers modes de génération tels que la création de vidéos à partir de textes, d’images ou de vidéos existantes. Fonctionnalités puissantes : contrôle précis et créativité infinie LTX-Video 13B excelle dans la cohérence des mouvements, la structure des scènes et la compréhension des relations entre les plans, générant ainsi des contenus vidéo logiques et détaillés. L’un de ses atouts majeurs est la possibilité de contrôler finement le processus de création. Les utilisateurs peuvent ajuster les actions des personnages, les transitions de scène et l'angle de prise de vue à l’aide de prompts de texte ou d’images de référence, offrant un contrôle granulaire pour atteindre des effets cinématographiques. De plus, le modèle propose des fonctionnalités de prolongation vidéo et de remplacement de styles/actions. Les utilisateurs peuvent étendre une vidéo existante jusqu’à 60 secondes, ou bien modifier son style pour transformer des scènes réelles en animations, par exemple. Cette flexibilité en fait un outil précieux pour la production de courts métrages, la conception publicitaire et la création de contenu pour les réseaux sociaux. Ecosystème open source : une plateforme puissante pour développeurs et créateurs LTX-Video 13B est librement disponible sous licence open source sur GitHub et Hugging Face, permettant à la communauté de développeurs et de créateurs de modifier et de personnaliser le modèle selon leurs besoins. Lightricks fournit également l'outil LTX-Video-Trainer, qui supporte l’ajustement complet des modèles de 2 et 13 milliards de paramètres, ainsi que l’entraînement par LoRA (Low-Rank Adaptation). Cela facilite le développement de modèles contrôlés spécifiques, tels que la détection de profondeur, de pose ou de contours. Le modèle est compatible avec le workflow ComfyUI, doté d'un nouveau nœud Looping Sampler qui permet la génération de vidéos de longueur arbitraire tout en assurant la cohérence des mouvements. Pour rendre l'usage plus accessible, Lightricks a publié plusieurs outils complémentaires, notamment une version 8 bits quantifiée (ltxv-13b-fp8) et l’outil IC-LoRA Detailer, optimisant la performance sur des appareils à faible mémoire. Lightricks met également le modèle à la disposition des startups et des organisations dont le chiffre d'affaires annuel est inférieur à 10 millions de dollars, aligné avec leur mission de démocratiser l'IA. Une nouvelle ère pour la génération de vidéos Selon AIbase, le lancement de LTX-Video 13B marque une étape importante dans l'évolution de la technologie de génération vidéo open source. En utilisant le rendu multi-échelles et en s’adaptant aux matériel grand public, ce modèle élimine la nécessité d’avoir des équipements haute performance pour obtenir des résultats professionnels, ouvrant ainsi la porte aux petits et moyens studios et aux créateurs individuels. Associé à la collaboration au sein de la communauté open source, LTX-Video 13B a le potentiel de stimuler des innovations supplémentaires dans la génération de vidéos, avec des applications possibles dans les domaines du cinéma, des jeux, de la publicité et de l'éducation. Actuellement intégré à la plateforme LTX Studio, le modèle ainsi que sa documentation sont disponibles sur les sites officiels de Lightricks : https://ltx.studio https://github.com/Lightricks/LTX-Video Lightricks prévoit de continuer à optimiser le modèle, en ajoutant plus de types de contrôle et des fonctionnalités multimodales pour better équiper les creatifs. Perspectives futures : redéfinir la création vidéo assistée par l’IA Lightricks a souligné que le développement de LTX-Video 13B a été largement facilité par des jeux de données de haute qualité fournis par des partenaires tels que Getty Images, garantissant la sécurité commerciale et l'attrait visuel des contenus générés. L’équipe travaille actuellement sur l’intégration d’hints temporels et de fonctionnalités multimodales pour soutenir des besoins de création plus complexes. AIbase anticipe que LTX-Video 13B, propulsé par la communauté open source, deviendra une référence dans le domaine de la génération vidéo par IA. Pour commencer, vous pouvez essayer le modèle sur : https://app.ltx.studio/gen-workspace Et le télécharger sur : https://ltxv.video/#get-started Ce lancement représente une nouvelle étape dans la création vidéo assistée par l'IA, offrant aux créateurs le pouvoir de réaliser leurs visions avec une précision et une fluidité jamais vues auparavant.