HyperAIHyperAI

Command Palette

Search for a command to run...

g2pM:基于新开放基准数据集的汉语神经图素到音素转换包

Kyubyong Park Seanie Lee

摘要

中文字符到音素的转换(Grapheme-to-Phoneme, G2P)是普通话文本转语音(Text-To-Speech, TTS)系统中的一个重要组成部分。中文G2P转换面临的最大挑战之一是如何消除多音字的发音歧义——即具有多个发音的汉字。尽管许多学术研究已经致力于解决这一问题,但至今仍缺乏一个公开的数据集作为标准基准,以便进行公平的比较。此外,大多数已报告的系统对于希望方便地将中文文本转换为拼音的研究人员或实践者来说难以使用。鉴于此,本研究引入了一个新的基准数据集,包含超过99,000个句子,用于中文多音字消歧。我们在该数据集上训练了一个简单的神经网络模型,并发现其性能优于其他现有的G2P系统。最后,我们将项目打包并发布在PyPi上。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供