Gemini AI: Fotos jetzt zu Videos umwandeln
Jess Weatherbed, eine News-Redakteurin mit Schwerpunkt auf den kreativen Industrien, Computertechnologie und Internetkultur, hat berichtet, dass Google eine neue Funktion für seine Gemini-KI eingeführt hat, die es Benutzern ermöglicht, Fotos in Videoclips umzuwandeln. Diese neue Funktion wird von Googles Veo 3 Video-Modell angetrieben und kann Referenzbilder in achtsekündige Videos umwandeln, die mit KI-generierter Audio-Begleitung versehen sind. Dies umfasst Hintergrundgeräusche, Umgebungsgeräusche und Sprechfunktionen. Die Gemini-Video-Update-Funktion ist nun für Google AI Ultra- und Pro-Abonnenten in ausgewählten Regionen verfügbar, wie Google mitteilte. Der Rollout beginnt heute im Web und wird in der kommenden Woche auch auf mobilen Geräten durchgeführt. Benutzer können die Funktion nutzen, indem sie auf die „Tools“-Option in der Eingabezeile klicken, „Video“ auswählen und ein Foto sowie eine textuelle Beschreibung des gewünschten Bewegungsverlaufs hochladen. Audio-Beschreibungen für Dialoge, Soundeffekte und atmosphärische Geräusche können ebenfalls hinzugefügt werden, wobei Google betont, dass diese perfekt mit den Bildern synchronisiert werden. Die fertigen Videos werden als MP4-Dateien in 720p-Auflösung und im Querformat 16:9 bereitgestellt. Google ermutigt Benutzer, kreativ zu sein, indem sie alltägliche Gegenstände animieren, ihre Zeichnungen und Gemälde zum Leben erwecken oder Bewegung in Naturbilder einbringen. Alle generierten Videos enthalten eine sichtbare Wasserzeichen-Markierung, die sie als KI-generiert kennzeichnet, sowie ein unsichtbares SynthID-Digitalsignatur-Wasserzeichen. Dies dient dazu, Missbrauch und die Verbreitung gefährlicher Inhalte zu verhindern. Eine ähnliche Funktion ist bereits in Flow, Googles generativer KI-Filmmach-Tool, das im März lanciert wurde, verfügbar. Mit dem neuen Update bei Gemini können Benutzer jedoch ihre Fotos in Videos umwandeln, ohne eine andere App öffnen zu müssen. Google kündigte an, dass Flow in weitere 75 Ländern zur Verfügung stehen wird, beginnend heute. Um die Sicherheit der Nutzer zu gewährleisten, setzt Google umfangreiche Maßnahmen ein. Dies umfasst „Red Teaming“, bei dem das Unternehmen seine Systeme proaktiv auf potenzielle Probleme hin überprüft und diese vor ihrem Auftreten behebt. Google führt auch gründliche Bewertungen durch, um zu verstehen, wie die Tools verwendet werden könnten und wie Missbrauch verhindert werden kann. Zudem entwickelt und setzt das Unternehmen kontinuierlich Richtlinien gegen unsichere Inhalte ein. Benutzer können durch das Drücken der Daumen-hoch- oder Daumen-runter-Buttons auf ihren generierten Videos Feedback geben, das Google zur Verbesserung seiner Sicherheitsmaßnahmen und des Gesamterlebnisses nutzt. Diese neuen Funktionen von Gemini und Flow spiegeln Googles ständiges Streben nach Innovation in der Bereich der Künstlichen Intelligenz wider. Sie bieten Benutzern neue Möglichkeiten, ihre kreativen Ideen umzusetzen und digitale Inhalte zu erstellen, die bislang nur mit viel Aufwand oder professioneller Ausrüstung möglich waren. Experten aus der Branche loben diese Entwicklung, da sie die Schaffensprozesse vereinfacht und erweitert. Google, eines der führenden Technologiekonzerne weltweit, investiert massiv in die Forschung und Entwicklung von KI-Technologien, um sowohl Nutzer als auch Unternehmen mit fortschrittlichen Werkzeugen zu versorgen. Die Ausweitung dieser Funktionen in zusätzliche Länder und die Implementierung von Sicherheitsmaßnahmen zeigen Googles Engagement sowohl für technologische Fortschritte als auch für ethische Verantwortung in der Nutzung von KI. Die Reaktionen der breiten Öffentlichkeit und der Fachcommunity sind bisher überwiegend positiv, obwohl einige Bedenken bezüglich der möglichen Missbrauchsmöglichkeiten bestehen. Dennoch bleibt Google bestrebt, diese Herausforderungen anzugehen und die Nutzererfahrung kontinuierlich zu verbessern.