HyperAI超神経

安定化 AI は本日、新しいオーディオモデルファミリー「Stable Audio 3.0」を発表しました。このシリーズには合計 4 つのモデルが含まれます：Small SFX（4.59 億パラメータ）、Small（4.59 億パラメータ）、Medium（14 億パラメータ）、Large（27 億パラメータ）。2 つの小規模モデルはエッジデバイス向けに設計されており、最大 2 分の音声や音楽を生成できます。一方、Medium および Large モデルでは、構造と調性を維持したまま、長さ 6 分 20 秒の楽曲全体を生成することが可能です。これは 2024 年に発表された Stable Audio 2.0 の生成時間制限である約半分以下から、実に 2 倍を超える長さに相当します。 Stability AI は Small SFX、Small、および Medium モデルについてオープンウェイトで公開し、誰でも利用・改変できるようにしています。これにより、従来 47 秒までの生成しか対応していなかった「Stable Audio Open」と比較して、開放版における能力が劇的に向上しました。一方で Large モデルは API とセルフホスト型の有料サービスを通じてのみ提供され、年間収益が 100 万米ドルを超える企業にはエンタープライズライセンスが必要です。現在の音楽生成市場は激しい競争状態にあります。Google や ElevenLabs など複数の企業が参入していますが、Suno と Udio を巡る訴訟事例からも示唆されるように、データ権利の確保やレコード会社との提携がこれらのサービスの持続可能性にとって鍵となる可能性があります。Stability AI は昨年、ワーナーミュージックグループとユニバーサルミュージックグループと契約を結びました。また、最新のオーディオモデルは完全に権限を取得したデータを用いて訓練されていることを明言しています。さらに同社は、プロフェッショナルな音楽家向けの新たなツールキットを開発中であることを明らかにしました。元ユニバーサルオーディオおよびフレンダー社の最高デジタル責任者であったイーサン・カプラン氏が Stability に加わり、専門的な音楽製品ラインの統括を担当することになりました。

関連リンク

関連リンク

関連リンク

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。

Command Palette

「Stability Audio 3.0」リリース：最大 6 分間のプロ級音楽、小・中規模モデルの重みオープン化

関連リンク

Command Palette

「Stability Audio 3.0」リリース：最大 6 分間のプロ級音楽、小・中規模モデルの重みオープン化

関連リンク

Command Palette

「Stability Audio 3.0」リリース：最大 6 分間のプロ級音楽、小・中規模モデルの重みオープン化

関連リンク

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。

オンラインチュートリアル | 27B の大きなモデルを 7.2GB に圧縮！ Ternary-Bonsai は「三進法の魔法」を使って、大きなモデルをパーソナルコンピュータで実行できるようにします。