HyperAIHyperAI

Command Palette

Search for a command to run...

注意模型在发音特征检测中的应用

Ievgen Karaulov; Dmytro Tkanov

摘要

发音特征以及音素转写在语音相关任务中发挥着重要作用,包括计算机辅助发音训练、文本到语音转换(TTS)、研究语音生成机制以及低资源语言的语音识别。近年来,端到端方法在语音相关任务中得到了广泛的关注。我们应用了“听、注意和拼写”(Listen, Attend and Spell, LAS)架构 \cite{Chan-LAS2016} 进行小规模训练集上的音素识别,例如 TIMIT 数据集 \cite{TIMIT-1992}。此外,我们提出了一种新的解码技术,该技术允许使用注意力模型端到端地训练发音方式和发音部位检测器。我们还探讨了在多任务学习框架下联合进行音素识别和发音特征检测的方法。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供