HyperAIHyperAI

Command Palette

Search for a command to run...

「Stability Audio 3.0」リリース:最大 6 分間のプロ級音楽、小・中規模モデルの重みオープン化

安定化 AI は本日、新しいオーディオモデルファミリー「Stable Audio 3.0」を発表しました。このシリーズには合計 4 つのモデルが含まれます:Small SFX(4.59 億パラメータ)、Small(4.59 億パラメータ)、Medium(14 億パラメータ)、Large(27 億パラメータ)。2 つの小規模モデルはエッジデバイス向けに設計されており、最大 2 分の音声や音楽を生成できます。一方、Medium および Large モデルでは、構造と調性を維持したまま、長さ 6 分 20 秒の楽曲全体を生成することが可能です。これは 2024 年に発表された Stable Audio 2.0 の生成時間制限である約半分以下から、実に 2 倍を超える長さに相当します。 Stability AI は Small SFX、Small、および Medium モデルについてオープンウェイトで公開し、誰でも利用・改変できるようにしています。これにより、従来 47 秒までの生成しか対応していなかった「Stable Audio Open」と比較して、開放版における能力が劇的に向上しました。一方で Large モデルは API とセルフホスト型の有料サービスを通じてのみ提供され、年間収益が 100 万米ドルを超える企業にはエンタープライズライセンスが必要です。 現在の音楽生成市場は激しい競争状態にあります。Google や ElevenLabs など複数の企業が参入していますが、Suno と Udio を巡る訴訟事例からも示唆されるように、データ権利の確保やレコード会社との提携がこれらのサービスの持続可能性にとって鍵となる可能性があります。Stability AI は昨年、ワーナーミュージックグループとユニバーサルミュージックグループと契約を結びました。また、最新のオーディオモデルは完全に権限を取得したデータを用いて訓練されていることを明言しています。 さらに同社は、プロフェッショナルな音楽家向けの新たなツールキットを開発中であることを明らかにしました。元ユニバーサルオーディオおよびフレンダー社の最高デジタル責任者であったイーサン・カプラン氏が Stability に加わり、専門的な音楽製品ラインの統括を担当することになりました。

関連リンク

「Stability Audio 3.0」リリース:最大 6 分間のプロ級音楽、小・中規模モデルの重みオープン化 | 人気の記事 | HyperAI超神経