HyperAI超神经

Google vient de lancer une nouvelle fonctionnalité d'intelligence artificielle (IA) pour sa plateforme Gemini, permettant de transformer des photos en vidéos courtes. Cette fonction, mise à disposition des abonnés Google AI Ultra et Pro dans certaines régions, utilise un modèle vidéo Veo 3 pour convertir des images de référence en clips vidéo de huit secondes, accompagnés d'audio généré par IA. Ce dernier peut inclure des bruits de fond, des sons environnementaux et même des paroles, parfaitement synchronisés avec les visuels. Pour accéder à cette fonction, les utilisateurs de Gemini doivent cliquer sur l'option « outils » dans la barre de saisie, sélectionner « vidéo », puis télécharger leur photo et fournir une description textuelle du mouvement souhaité. Des instructions audio peuvent également être ajoutées pour le dialogue, les effets sonores et le bruit ambiant. Les vidéos générées sont livrées au format MP4, en 720p et en format paysage 16:9. Google encourage les utilisateurs à expérimenter en animant des objets quotidiens, en donnant vie à leurs dessins ou peintures, ou en ajoutant du mouvement à des scènes naturelles. Cette fonctionnalité de photo-to-vidéo est déjà disponible dans Flow, l'outil de réalisation cinématographique générée par IA lancé par Google en mars. Cependant, la nouveauté réside dans le fait que les utilisateurs de Gemini peuvent désormais animer leurs photographies sans avoir besoin d'ouvrir une autre application. Flow, quant à lui, sera déployé dans 75 pays supplémentaires aujourd'hui, en plus du lancement de la nouvelle fonctionnalité de Gemini. La disponibilité de cette fonctionnalité commence aujourd'hui sur le web et sera progressivement étendue aux appareils mobiles tout au long de la semaine. Les utilisateurs peuvent accéder à la fonction via l'URL gemini.google.com. Une fois la vidéo générée, ils peuvent la partager directement ou la télécharger pour la diffuser auprès de leurs amis et de leur famille. Google souligne son engagement en matière de sécurité lors de l'utilisation de ces outils de génération de vidéos. L'entreprise met en place des mesures rigoureuses, notamment des tests intensifs par des équipes de réduction des risques (« red teaming »), pour identifier et corriger les problèmes potentiels avant qu'ils ne surviennent. Des évaluations approfondies sont également réalisées pour comprendre les usages possibles de ces outils et prévenir tout usage inapproprié. Google développe et applique constamment des politiques visant à interdire le contenu dangereux. Toutes les vidéos générées par IA comportent un filigrane visible indiquant qu'elles sont créées par IA, ainsi qu'un filigrane numérique SynthID invisible. Google invite les utilisateurs à donner leur avis en utilisant les boutons de pouce vers le haut ou vers le bas sur les vidéos générées. Ces retours serviront à améliorer continuellement les mesures de sécurité et l'expérience globale. Jess Weatherbed, journaliste spécialisée dans les industries créatives, l'informatique et la culture internet, a couvert cette actualité. Elle a débuté sa carrière chez TechRadar, où elle a traité des nouvelles et réalisé des tests de matériel. La fonctionnalité photo-to-vidéo de Gemini marque une étape importante dans l'évolution des outils d'IA, offrant aux utilisateurs une flexibilité et une créativité accrues sans nécessiter des compétences techniques avancées. Les experts de l'industrie saluent cette initiative, estimant qu'elle pourrait encourager davantage de personnes à explorer la création de contenu vidéo. Cette technologie pourrait également avoir un impact significatif sur les domaines de la publicité, de l'enseignement et du divertissement, en facilitant la production de contenus visuels attrayants et engageants. Cependant, certains soulignent l'importance des mesures de sécurité et de transparence mises en place par Google pour éviter toute manipulation ou diffusion de fausses informations. Google, une entreprise de technologie leader, continue d'innover et de repousser les limites de ce qui est possible avec l'IA. La nouvelle fonctionnalité photo-to-vidéo de Gemini témoigne de l'engagement de l'entreprise à rendre la technologie accessible tout en veillant à ce qu'elle soit utilisée de manière responsable et éthique. L'expansion de Flow dans 75 pays supplémentaires renforce encore la présence de Google dans le domaine de la création de contenu générée par IA, suscitant des réactions positives de la part des utilisateurs et des professionnels de l'industrie.

Gemini AI transforme vos photos en vidéos.

Related Links