ECCV 2026 : VERTIGO, l'IA pour les trajectoires de caméra
L’équipe MAGIC Lab de l’Académie des films de Shanghai University, dirigée par la chercheuse Li Mengtian, a vu son article intitulé VERTIGO accepté à la prestigieuse conférence ECCV 2026 en vision par ordinateur. Cette recherche, dirigée par le master Lu Yuwei et la licence Li Feifei, bénéficie du soutien du fonds national chinois pour les sciences naturelles et d’une collaboration avec l’Institut Polytechnique de Paris. Elle marque une avancée notable dans l’intégration de l’intelligence artificielle aux processus de création cinématographique. Les modèles génératifs récents savent déjà générer des trajectoires de caméra 3D à partir de consignes textuelles, mais ils peinent à respecter les standards esthétiques du cinéma. Leurs sorties présentent fréquemment des défauts de cadrage, des personnages qui sortent du champ ou une faible qualité visuelle. VERTIGO répond à cette limite en introduisant un mécanisme d’optimisation des préférences visuelles qui s’approche du jugement humain d’un réalisateur ou d’un directeur de la photographie. Le système repose sur une boucle d’entraînement à haute vitesse. Un moteur de rendu en temps réel transforme instantanément les trajectoires 3D proposées en aperçus 2D. Un modèle visuel de grande taille, préalablement affiné sur des critères de photographie cinématographique, analyse ensuite ces images. Au lieu d’assigner un score numérique arbitraire, il produit une description textuelle détaillée de la composition. Cette description est confrontée sémantiquement à la demande initiale pour identifier les écarts, permettant au générateur de corriger ses trajectoires de façon ciblée et itérative. Pour alimenter ce processus, les chercheurs ont construit le jeu de données LenScript, qui reste à ce jour le plus complet dans son domaine. Il rassemble 120 000 trajectoires et 21,6 millions d’images, finement annotées selon cinq dimensions techniques du cinéma. L’application de l’optimisation directe des préférences sur ce corpus permet à VERTIGO d’atteindre une précision géométrique comparable aux meilleurs modèles actuels, tout en quasi-éliminant les erreurs de cadrage. Des tests auprès de 34 experts, incluant des réalisateurs et des cadreur, ont confirmé ses avantages en matière de composition, de fidélité aux consignes et d’harmonie visuelle. Au-delà d’une performance technique, VERTIGO établit un lien direct entre la géométrie pure des trajectoires et la réalité visuelle des plans filmés. Cette capacité rend l’IA directement opérationnelle pour la prévisualisation de films, la production automatisée de séries courtes et l’animation dynamique. En plaçant l’efficacité artistique au centre du développement algorithmique, cette publication positionne Shanghai University comme un acteur crédible sur la scène internationale de l’IA créative et inspire une approche où la technologie sert explicitement les exigences narrativess et esthétiques du cinéma.
