Google stellt Lyria 3 vor: KI erzeugt in Sekunden Musik mit Gesang aus Text, Bild oder Video
Google hat mit Lyria 3 eine bedeutende Neuerung im Bereich künstlicher Intelligenz für Musik vorgestellt, die in der Lage ist, innerhalb von Sekunden ein 30-Sekunden-Track mit Gesang, Instrumental und Text zu generieren – basierend auf Textbeschreibungen, Bildern oder sogar Videos. Im Gegensatz zu Konkurrenten wie Suno und Udio, die längere Musikstücke erstellen können, beschränkt sich Lyria 3 derzeit auf kurze Clips. Doch Google betont, dass diese Tracks eine hohe Klangqualität aufweisen und alle Elemente einer vollständigen Musikproduktion enthalten: Melodie, Harmonie, Rhythmus, Gesang und Texte, die konsistent mit dem Eingabematerial sind. Die Funktionen von Lyria 3 sind besonders innovativ, da sie nicht nur auf Texte reagiert, sondern auch visuelle Eingaben verarbeiten kann. Ein Foto einer Landschaft kann beispielsweise in eine atmosphärische, instrumentale Ballade mit passenden Gesangslinien umgewandelt werden. Ebenso kann ein kurzer Videoausschnitt – etwa ein Tanzvideo oder ein Filmclip – als Inspirationsquelle für eine Musikstrophe dienen, wobei die AI die Stimmung, Tempo und emotionale Ausrichtung erkennt und musikalisch umsetzt. Diese multimodale Fähigkeit macht Lyria 3 zu einem der ersten AI-Tools, das visuelle und audiovisuelle Eingaben gleichwertig verarbeitet. Im Vergleich zu früheren Versionen von Lyria ist die dritte Generation deutlich leistungsfähiger. Die früheren Modelle konnten nur Instrumentalstücke generieren oder verfügten über eingeschränkte Text- und Gesangsfunktionen. Lyria 3 hingegen nutzt eine verbesserte Sprach- und Musiksynthese-Technologie, die realistisch klingende Stimmen erzeugt, die auch emotionale Nuancen wie Weichheit, Energie oder Traurigkeit wiedergeben können. Die Textgenerierung erfolgt dabei kontextabhängig und passt sich dem musikalischen Stil an – ob Pop, Jazz, elektronisch oder klassisch. Obwohl die 30-Sekunden-Grenze die Nutzung für komplette Songs begrenzt, ist die Technologie für kreative Prototypen, Werbe- und Content-Produktionen ideal. Kreative können schnell Ideen testen, Musik für TikTok-Clips, YouTube-Videos oder Spiele erstellen. Google positioniert Lyria 3 als Werkzeug für Künstler, die ihre Produktivität steigern wollen, ohne tief in Musikproduktion einsteigen zu müssen. Industrieexperten sehen in Lyria 3 einen bedeutenden Schritt vorwärts, insbesondere durch die Integration visueller Eingaben. „Das ist der erste echte Schritt hin zu einer wirklich multimodalen Musik-Generation“, sagt ein KI-Experte von einem Berliner Tech-Startup. „Obwohl die Länge begrenzt ist, ist die Qualität und Konsistenz der Ausgaben beeindruckend.“ Google selbst betont, dass Lyria 3 Teil eines breiteren Ökosystems von KI-Tools ist, das in den kommenden Monaten erweitert werden soll. Die Plattform ist bisher nur in der Beta-Phase für ausgewählte Entwickler und Partner zugänglich, könnte aber bald für eine breitere Öffentlichkeit freigegeben werden.
