Runway dévoile Gen-4.5 : une IA vidéo texte-à-image aux images « indistinguables du réel »
Runway affirme que son nouveau générateur d’images vidéo à partir de texte, baptisé Gen-4.5, atteint une précision « sans précédent ». Dans un billet publié lundi, l’entreprise souligne que ce modèle produit des visuels encore plus fidèles que ses prédécesseurs, avec des résultats cinématographiques et hautement réalistes, rendant parfois difficile la distinction entre ce qui est réel et ce qui est généré par l’intelligence artificielle. Selon Runway, le Gen-4.5 « réalise une précision physique et visuelle inégalée », tout en respectant mieux les instructions données. Il permet de créer des scènes détaillées sans compromis sur la qualité vidéo. Les objets générés par l’IA se déplacent avec une masse, une inertie et une force réalistes, tandis que les liquides s’écoulent selon des dynamiques physiques crédibles. Le modèle est progressivement déployé à tous les utilisateurs, tout en maintenant la même rapidité et l’efficacité que son prédécesseur. Toutefois, des limites persistent : le modèle peine parfois à maintenir la permanence des objets ou à respecter la logique causale. Par exemple, une porte pourrait s’ouvrir avant que quelqu’un ne touche la poignée, ce qui rompt la cohérence narrative. Parallèlement à Runway, OpenAI intensifie ses efforts pour rendre ses vidéos générées plus réalistes. En septembre, la société a présenté une mise à jour de son modèle Sora, désormais appelé Sora 2, qui améliore significativement la modélisation physique. Bill Peebles, responsable du projet Sora, a souligné que l’IA peut désormais reproduire des mouvements complexes comme un backflip sur une planche à voile sur l’eau, avec une gestion précise des dynamiques fluides et de la flottabilité. Runway affirme également que le Gen-4.5 excelle dans la gestion de différents styles visuels, offrant une cohérence remarquable entre des rendus photoréalistes, stylisés ou cinématographiques. L’entreprise affirme que les vidéos générées avec ce modèle peuvent être « indiscernables du tournage réel », grâce à un niveau de détail et de fidélité qui s’approche de la réalité.
