HyperAI
Back to Headlines

Google ouvre Veo 3, son générateur vidéo AI, au public : comment l'essayer

il y a 4 jours

Google met Veo 3, son générateur vidéo piloté par l'IA, à disposition de tous Le géant de la technologie Google a annoncé jeudi que Veo 3, son tout dernier modèle de génération de vidéos basé sur l'intelligence artificielle (IA), est maintenant disponible en version de prévisualisation publique. Ce logiciel, qui avait suscité une grande attention lors de sa présentation lors de la conférence annuelle des développeurs de Google, I/O, en mai, est désormais accessible à tous les clients et partenaires de Google Cloud via la Vertex AI Media Studio. Capacités de Veo 3 Veo 3 marque un progrès significatif dans le domaine de la génération de vidéos synchronisées avec l'audio, un défi technique qui a longtemps été une pierre d'achoppement. Par exemple, si vous demandez au système de créer une vidéo dans une rame bondée de métro, Veo 3 peut non seulement générer l'image mais aussi y ajouter des bruits ambiantes réalistes, comme le bourdonnement d'une foule ou le cliquetis des wagons. L'outil peut même produire des sons de voix humaines, ce qui ajoute un niveau supplémentaire de réalisme. Le modèle excelle également dans la simulation des lois physiques du monde réel, notamment la dynamique des fluides, le mouvement des ombres, et d'autres aspects visuels et sonores. Cela permet d'obtenir des vidéos d'une précision incroyable, qui peuvent être particulièrement utiles pour les productions cinématographiques et les contenus créatifs en général. Utilisation facile via des commandes textuelles Les utilisateurs peuvent créer des vidéos avec Veo 3 en entrant des prompts textuels en langage naturel et en affinant leurs instructions pour modifier des détails créatifs subtils. Google illustre cela en donnant l'exemple de la possibilité de adjusts la teinte du ciel ou la manière précise dont le soleil brille sur l'eau en pleine lumière de fin d'après-midi. Cette flexibilité offre aux créateurs de contenu un contrôle sans précédent sur la qualité et le style de leurs productions. Cas d'utilisation et limitations Google a indiqué que diverses entreprises, y compris dans le secteur de la publicité, ont déjà commencé à expérimenter Veo 3 pour créer du contenu destiné aux clients, tel que des publicités sur les médias sociaux, des démonstrations de produits, et des vidéos de formation internes. Selon un PDG de l'un des utilisateurs, il s'agit de "la plus grande avancée en IA pratiquement utile pour la publicité depuis l'émergence des premiers modèles de génératifs en 2023". Cependant, l'accueil parmi les professionnels de la création a été mitigé. Certains voient un potentiel positif pour l'avenir de la fabrication de films assistée par l'IA. L'illustre réalisateur Darren Aronofsky, par exemple, a noué un partenariat créatif avec Google DeepMind. De même, le studio Lionsgate a conclu un accord avec l'IA startup Runway pour explorer les possibilités offertes par cette technologie. D'autres professionnel·les du divertissement sont plus critiques face à la montée de l'IA dans leur secteur. Une publicité vidéo pour Toys R' Us créée l'an dernier à l'aide d'OpenAI's Sora a été largement moquée en ligne, illustrant les risques de mauvaise utilisation. Les syndicats de travailleurs du divertissement organisent des actions pour protéger leurs emplois tandis que la technologie continue de se développer rapidement. Impacts sur l'industrie de la publicité Les entreprises technologiques ne se sont pas arrêtées là. Amazon Ads a récemment lancé sa propre outil de génération de vidéo IA à travers les États-Unis. De son côté, Meta envisage d'automatiser chaque étape du processus de production publicitaire, soulignant la concurrence intense dans ce domaine. Défis techniques La capacité de Veo 3 à générer des vidéos synchronisées avec l'audio représente un des premiers succès majeurs d'un développeur tech important dans ce domaine. D'autres outils existants, comme Runway's Gen-3 Alpha, proposent des fonctionnalités permettant l'ajout d'audio à des vidéos après leur production, mais la génération simultanée des deux nécessite des ressources de calcul considérables que seule une entreprise de la taille de Google peut mobiliser. Fusionner vidéo et audio IA est un défi complexe car les vidéos sont constituées d'images fixes successives, alors que l'audio est une onde continue. Pour synchroniser les deux, les modèles doivent opérer dans deux modalités différentes, en tenant compte des échelles temporelles très différentes. Ils doivent également être capables de gérer dynamiquement des variables telles que le matériau, la distance, et la vitesse. Par exemple, un cheval marchant sur des pavés sonne différemment de celui marchant sur l'herbe, tout comme une voiture roulant à 160 km/h a un son différent de celle qui roule à 16 km/h. Contexte et perspectives Google investit massivement dans le développement de technologies IA capables de générer des vidéos à partir de prompts textuels, prévoyant que cette fonctionnalité deviendra un usage courant dans les industries créatives. Ce mouvement est alimenté par l'idée que l'IA pourra aider à créer du contenu plus rapidement et avec moins de ressources, ce qui est particulièrement attractif pour les annonceurs et les producteurs. L'annonce de la disponibilité publique de Veo 3 pourrait donc être un tournant décisif pour l'adoption de l'IA dans la production vidéo. Toutefois, elle suscite également des préoccupations sur l'emploi et l'éthique, des questions qui continuent de susciter des débats au sein des industries créatives. Evaluation par des professionnels et profil de Google Selon Darren Aronofsky, l'IA comme Veo 3 a le potentiel de transformer radicalement la façon dont les films sont réalisés, offrant une créativité inégalée aux scénaristes et aux réalisateurs. Cependant, les syndicats du divertissement sont méfiants et organisent des actions pour défendre les intérêts des travailleurs. Google, en mettant Veo 3 à la disposition de tous ses clients Cloud, réaffirme son engagement à rendre l'IA accessible et utile pour les industries créatives. La société espère que cette technologie aidera à réduire les coûts et accélérer le processus de création, tout en ouvrant de nouvelles opportunités pour les créateurs de contenu et les entreprises. En conclusion, bien que Veo 3 présente de nombreux avantages, son déploiement à grande échelle soulève des questions importantes sur l'impact de l'IA sur les professions créatives. Les débats continueront, mais il est clair que cette technologie a le potentiel de redéfinir les frontières de la création numérique.

Related Links