HyperAIHyperAI

Command Palette

Search for a command to run...

Overflow:在神经转导器上添加流以改进TTS

Shivam Mehta Ambika Kirkland Harm Lameris Jonas Beskow Éva Székely Gustav Eje Henter

摘要

神经隐马尔可夫模型(Neural HMMs)是一种最近提出的用于文本到语音序列到序列建模的神经转导器。它们结合了经典统计语音合成和现代神经TTS的最佳特性,需要较少的数据和训练更新次数,并且不易因神经注意力机制失效而产生无意义的输出。在本文中,我们将神经HMM TTS与正态流(normalising flows)相结合,以描述语音声学的高度非高斯分布。结果是一个强大的、完全概率性的时长和声学模型,可以使用精确的最大似然估计进行训练。实验表明,基于我们提出的方法构建的系统比类似方法需要更少的更新次数即可生成准确的发音,并且主观语音质量接近自然语音。请参阅https://shivammehta25.github.io/OverFlow/ 获取音频示例和代码。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供