HyperAIHyperAI

Command Palette

Search for a command to run...

Sortie de Stability Audio 3.0 : musique professionnelle jusqu'à 6 minutes et poids ouverts pour les modèles de petite à moyenne taille

La société derrière Stable Diffusion, Stability AI, a publié aujourd'hui une nouvelle famille de modèles audio nommée Stable Audio 3.0, composée de quatre modèles : Small SFX (4,59 milliard de paramètres), Small (4,59 milliards de paramètres), Medium (1,4 milliard de paramètres) et Large (2,7 milliards de paramètres). Les deux petits modèles sont adaptés aux appareils en bordure du réseau et peuvent générer des pistes audio et musicales d'une durée allant jusqu'à 2 minutes. Les modèles Medium et Large permettent quant à eux la création complète d'œuvres musicales de 6 minutes et 20 secondes tout en préservant leur structure musicale et leurs tonalités mélodiques — soit plus du double de la durée maximale atteinte par le modèle Stable Audio 2.0 lancé en 2024. Stability AI publie les poids ouverts pour les modèles Small SFX, Small et Medium, afin qu'ils puissent être utilisés et modifiés par tous. Par rapport au précédent modèle Stable Audio Open, qui ne prenait en charge que des générations de 47 secondes, cette nouvelle génération offre un bond significatif dans sa version ouverte. Le modèle Large est uniquement accessible via API et service payant hébergé sur site ; les entreprises réalisant un chiffre d'affaires annuel supérieur à 1 million de dollars doivent obtenir une licence entreprise. Le secteur de la génération musicale fait actuellement l'objet d'une concurrence intense, avec l'entrée de sociétés telles que Google et ElevenLabs. Cependant, les litiges impliquant Suno et Udio soulignent que l'autorisation des données et la collaboration avec les maisons de disques pourraient constituer un élément clé de survie à long terme pour ces services. L'an dernier, Stability AI avait déjà signé des accords avec Warner Music Group et Universal Music Group, indiquant également que ses nouveaux modèles audio ont été entraînés exclusivement sur des données dûment autorisées. Par ailleurs, la société a annoncé travailler sur un nouveau kit destiné aux musiciens professionnels. Ethan Kaplan, ancien directeur numérique chez Universal Audio et Fender, s'est joint à Stability AI pour diriger la gamme de produits dédiée aux professionnels de la musique.

Liens associés

Sortie de Stability Audio 3.0 : musique professionnelle jusqu'à 6 minutes et poids ouverts pour les modèles de petite à moyenne taille | Articles tendance | HyperAI