HyperAIHyperAI

Command Palette

Search for a command to run...

WaveGlow: 音声合成のためのフローベースの生成ネットワーク

A. van den Oord S. Dieleman H. Zen K. Simonyan O. Vinyals A. Graves N. Kalchbrenner

概要

本論文では、WaveGlowというフローに基づくネットワークを提案します。このネットワークはメルスペクトログラムから高品質な音声を生成する能力を持っています。WaveGlowは、GlowとWaveNetの洞察を組み合わせることで、自己回帰(auto-regression)を必要とせずに高速で効率的かつ高品質な音声合成を提供します。WaveGlowは単一のネットワークのみを使用し、訓練データの尤度最大化という単一のコスト関数のみで学習が行われるため、学習プロセスがシンプルかつ安定しています。当社のPyTorch実装では、NVIDIA V100 GPU上で秒間500,000サンプル以上の音声生成速度を達成しています。平均意見得点(Mean Opinion Scores)によると、WaveGlowは公開されている最高品質のWaveNet実装に匹敵する音質を提供することが示されています。本研究に関連するすべてのコードはオンラインで公開される予定です。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
WaveGlow: 音声合成のためのフローベースの生成ネットワーク | 記事 | HyperAI超神経