HyperAIHyperAI

Command Palette

Search for a command to run...

SampleRNN: 無条件のエンドツーエンド神経音声生成モデル

Soroush Mehri Kundan Kumar Ishaan Gulrajani Rithesh Kumar Shubham Jain Jose Sotelo Aaron Courville Yoshua Bengio

概要

本論文では、無条件音声生成のための新しいモデルを提案します。このモデルは、一回に一つの音声サンプルを生成することに基づいています。我々は、階層構造でメモリーレスモジュール(すなわち自己回帰多層パーセプトロン)と状態保持型再帰ニューラルネットワークを組み合わせることで、異なる性質を持つ3つのデータセットにおいて非常に長い時間範囲での時系列データの変動源を捉えることができることを示します。生成されたサンプルの人間評価では、当モデルが競合するモデルよりも優れていることが示されています。また、各コンポーネントがどのようにしてモデルの性能向上に寄与しているかも説明しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
SampleRNN: 無条件のエンドツーエンド神経音声生成モデル | 記事 | HyperAI超神経