8ヶ月前

拡散モデル

アプローチ／フレームワーク

オーディオ

マルチモーダル

Li Peike ; Chen Boyu ; Yao Yao ; Wang Yikai ; Wang Allen ; Wang Alex

概要

音楽生成は、深層生成モデルの進歩に伴い、ますます注目を集めています。しかし、テキスト記述に基づいて音楽を生成するタスク（テキストから音楽への変換、text-to-music）は、音楽構造の複雑さと高いサンプリングレートの要件により、依然として困難を伴っています。このタスクの重要性にもかかわらず、現行の生成モデルは音楽品質、計算効率性、汎化能力において制限があることが示されています。本論文では、JEN-1という普遍的な高忠実度モデルを紹介します。JEN-1は、自己回帰および非自己回帰訓練を組み合わせた拡散モデルです。コンテクスト内学習を通じて、JEN-1はテキストガイドによる音楽生成、音楽インペイント（music inpainting）、継続生成などの様々な生成タスクを遂行します。評価結果は、JEN-1がテキストと音楽の整合性や音楽品質において最先端の手法よりも優れた性能を示していることを示しています。また、計算効率性も維持しています。デモは以下のURLで利用可能です: https://jenmusic.ai/audio-demos

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

拡散モデル

アプローチ／フレームワーク

オーディオ

マルチモーダル

Li Peike ; Chen Boyu ; Yao Yao ; Wang Yikai ; Wang Allen ; Wang Alex

概要

音楽生成は、深層生成モデルの進歩に伴い、ますます注目を集めています。しかし、テキスト記述に基づいて音楽を生成するタスク（テキストから音楽への変換、text-to-music）は、音楽構造の複雑さと高いサンプリングレートの要件により、依然として困難を伴っています。このタスクの重要性にもかかわらず、現行の生成モデルは音楽品質、計算効率性、汎化能力において制限があることが示されています。本論文では、JEN-1という普遍的な高忠実度モデルを紹介します。JEN-1は、自己回帰および非自己回帰訓練を組み合わせた拡散モデルです。コンテクスト内学習を通じて、JEN-1はテキストガイドによる音楽生成、音楽インペイント（music inpainting）、継続生成などの様々な生成タスクを遂行します。評価結果は、JEN-1がテキストと音楽の整合性や音楽品質において最先端の手法よりも優れた性能を示していることを示しています。また、計算効率性も維持しています。デモは以下のURLで利用可能です: https://jenmusic.ai/audio-demos

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

JEN-1: テキストガイダンスによる全方向拡散モデルを用いた普遍的な音楽生成 | 記事 | HyperAI超神経