HyperAI

Das Unternehmen hinter Stable Diffusion, Stability AI, hat heute die neue Familie von Audiomodellen „Stable Audio 3.0" vorgestellt, bestehend aus vier Modellen: Small SFX mit 4,59 Milliarden Parametern, Small ebenfalls mit 4,59 Milliarden Parametern, Medium mit 1,4 Milliarden Parametern und Large mit 2,7 Milliarden Parametern. Die beiden kleinen Modelle sind für Endgeräte geeignet und können Audiospuren sowie Musikstücke bis zu einer Länge von zwei Minuten generieren. Die Modelle Medium und Large hingegen erzeugen vollständige Musikwerke von insgesamt sechs Minuten und zwanzig Sekunden und bewahren dabei sowohl musikalische Strukturen als auch melodische Tonarten – eine Dauer, die mehr als doppelt so lang ist wie bei dem im Jahr 2024 veröffentlichten Modell Stable Audio 2.0. Stability AI stellt die Modelle Small SFX, Small und Medium unter offenen Gewichten zur Verfügung, sodass sie von jedermann genutzt und modifiziert werden dürfen. Im Vergleich zum bisherigen nur auf eine Generierungsdauer von 47 Sekunden beschränkten Modell Stable Audio Open markiert diese Neuauflage einen erheblichen Fortschritt in der offenen Version. Das große Modell wird ausschließlich über APIs und kostenpflichtige Self-Hosting-Dienste bereitgestellt; Unternehmen mit einem Jahresumsatz von mehr als einer Million US-Dollar benötigen zudem eine Unternehmenslizenz. Derzeit herrscht ein intensiver Wettbewerb im Bereich der Musikkgenerierung, wobei zahlreiche Firmen wie Google oder ElevenLabs eingestiegen sind. Doch die Rechtsstreitigkeiten zwischen Suno und Udio zeigen, dass die Einholung von Datenlizenzen durch Zusammenarbeit mit Plattenlabels möglicherweise entscheidend für das langfristige Überleben dieser Dienste sein könnte. Stability AI hatte bereits letztes Jahr Vereinbarungen mit Warner Music Group und Universal Music Group getroffen und betont, dass seine neuesten Audiemodelle vollständig lizensierte Trainingsdaten verwenden. Zusätzlich gab das Unternehmen bekannt, dass es an neuen Werkzeugpaketen speziell für professionelle Musiker arbeitet. Ethan Kaplan, ehemaliger Chief Digital Officer bei Universal Audio und Fender, ist nun Teil des Teams von Stability AI und leitet dort die Produktlinie für den professionellen Musikbereich.

Verwandte Links

Verwandte Links

Verwandte Links

Online-Tutorial | Komprimieren Sie Ein 27 Byte Großes Modell Auf 7,2 GB! Ternary-Bonsai Nutzt „ternäre Magie“, Um Große Modelle Auf PCs Lauffähig Zu machen.

Online-Tutorial | Komprimieren Sie Ein 27 Byte Großes Modell Auf 7,2 GB! Ternary-Bonsai Nutzt „ternäre Magie“, Um Große Modelle Auf PCs Lauffähig Zu machen.

Command Palette

Veröffentlichung von Stability Audio 3.0: bis zu sechs Minuten professionelle Musik, Gewichte des kleineren Modells als Open Source verfügbar

Verwandte Links

Command Palette

Veröffentlichung von Stability Audio 3.0: bis zu sechs Minuten professionelle Musik, Gewichte des kleineren Modells als Open Source verfügbar

Verwandte Links

Command Palette

Veröffentlichung von Stability Audio 3.0: bis zu sechs Minuten professionelle Musik, Gewichte des kleineren Modells als Open Source verfügbar

Verwandte Links

Online-Tutorial | Komprimieren Sie Ein 27 Byte Großes Modell Auf 7,2 GB! Ternary-Bonsai Nutzt „ternäre Magie“, Um Große Modelle Auf PCs Lauffähig Zu machen.

Online-Tutorial | Komprimieren Sie Ein 27 Byte Großes Modell Auf 7,2 GB! Ternary-Bonsai Nutzt „ternäre Magie“, Um Große Modelle Auf PCs Lauffähig Zu machen.