Veo 3 kann nun Bilder in Sprechvideos umwandeln.
Veo 3 unterstützt nun Bild-Eingaben – Erste Schritte mit generativer KI Google hat in seinem neuesten Videomodell, Veo 3, eine der am häufigsten erwarteten Funktionen eingeführt: die Möglichkeit, Videos aus einem Bildinput zu generieren. Dies bedeutet, dass Benutzer ein Porträtfoto hochladen und einen Text im Prompt-Feld eingeben können, um ein Video zu erstellen, in dem das dargestellte Subjekt spricht. Sie können auch Szenen generieren, in denen das Subjekt singt, Werbeslogans vorträgt oder sogar Witze macht. Diese Aktualisierung löst eines der schwierigsten Workflows bei KI-generierten Videos: die Erstellung konsistenter Charaktere über mehrere Szenen hinweg. Benutzer können mehrere Porträts von einem trainierten Bildmodell generieren und diese in Veo 3 einfügen, um sie in Videoclips zu verwandeln. Die Bild-Eingabe-Funktion ist Teil der neuen Updates, die im Juni 2025 eingeführt wurden. Wenn Sie die Flow-App auf Google Labs öffnen, sehen Sie folgende Nachricht: "Veo 3: Erste Frames zu Videos mit Sprache. Hochladen Sie ein Bild Ihres Charakters und geben Sie ihm eine Stimme. Bitte beachten Sie, dass die Audiofunktion noch in Beta-Phase ist, daher kann es vorkommen, dass Ihre Videos keinen Ton haben." Es wird an Benutzer erinnert, dass sie die notwendigen Rechte für alle hochgeladenen Inhalte besitzen müssen und dass sie keine Inhalte generieren dürfen, die Urheberrechte verletzen. Die Einführung der Bild-Eingabe-Funktion bei Veo 3 markiert einen wichtigen Meilenstein in der Entwicklung von KI-gestützten Video-Tools. Bislang war die Erstellung von Videos, die konsistente Charaktere über mehrere Szenen hinweg zeigten, ein komplexer und oft manuell durchzuführender Prozess. Die neue Funktion vereinfacht dies erheblich, indem sie den KI-Algorithmus ermöglicht, das Erscheinungsbild des Charakters in verschiedenen Szenen konsistent zu halten. Dies ist besonders nützlich für die Erstellung von Animationsfilmen, Werbeclips und interaktiven Präsentationen, wo konsistente Darstellungen entscheidend sind. Ein weiterer Vorteil der Bild-Eingabe-Funktion ist die Flexibilität, die sie bietet. Benutzer können nicht nur ein einzelnes Porträtfoto verwenden, sondern auch verschiedene Bilder von einem Modell, um unterschiedliche Emotionen oder Bewegungen darzustellen. Dies erweitert die Möglichkeiten der Kreativität und ermöglicht es, Videos zu erstellen, die natürlicher und lebendiger wirken. Allerdings gibt es auch Herausforderungen. Die Audiofunktion ist noch in der Testphase, was bedeutet, dass die Tonqualität und -konsistenz verbessert werden müssen. Zudem ist die Ethik der KI-gestützten Content-Erstellung ein wichtiger Aspekt, den Benutzer berücksichtigen müssen. Es ist entscheidend, sicherzustellen, dass die generierten Inhalte respektvoll und rechtlich einwandfrei sind, insbesondere wenn es um die Darstellung realer Personen oder markenbezogener Inhalte geht. Die Branche reagiert begeistert auf die Neuerung. Experten sehen in Veo 3 ein Werkzeug, das die Schaffung von personalisierten und ansprechenden Videoinhalten revolutionieren kann. Die Fähigkeit, konsistente Charaktere zu generieren, wird als besonders wertvoll angesehen, da sie die Produktion von langen Videosequenzen und Fortschreibungen erleichtert. Google Labs ist bekannt für seine fortschrittlichen Forschungsprojekte im Bereich Künstliche Intelligenz. Die Flow-App, in der Veo 3 integriert ist, bietet Benutzern ein intuitives Interface, um ihre Ideen zu realisieren. Google setzt sich kontinuierlich für die Weiterentwicklung und Verbreitung von KI-Technologien ein, um den Zugang zu fortschrittlichen Tools für eine breitere Nutzergruppe zu erleichtern. Zusammenfassend lässt sich sagen, dass die Bild-Eingabe-Funktion in Veo 3 ein wichtiger Schritt in Richtung einer einfachen und flexiblen KI-gestützten Videoerstellung darstellt. Die technischen Herausforderungen und ethischen Bedenken sollten jedoch nicht übersehen werden. Mit der richtigen Handhabung hat Veo 3 das Potenzial, die Medien- und Unterhaltungsindustrie erheblich zu beeinflussen.