Command Palette

Search for a command to run...

DiaMoE-TTS 多方言语音表音数据集

日期

11 小时前

机构

Giant Network(巨人网络)
Tsinghua University

论文链接

2509.22727

许可协议

CC BY 4.0

加入 Discord 社区

DiaMoE-TTS 是由清华大学联合巨人网络于 2025 年发布的一个面向多方言文本到语音合成(TTS)任务的语音数据集,相关论文成果为「DiaMoE-TTS: A Unified IPA-Based Dialect TTS Framework with Mixture-of-Experts and Parameter-Efficient Zero-Shot Adaptation」,旨在构建统一的方言语音表音体系,支持多方言之间的可迁移语音建模与零样本方言合成研究。

该数据集基于多个开源方言语音资源构建,采用 IPA(国际音标)作为统一表音体系,用于对不同方言语料进行一致的音系标注。数据集的语音来源包括 Common Voice 粤语数据集、 Emilia 普通话语料、 KeSpeech 语料库中的方言语音,以及开源的闽南语语音数据集。在数据处理过程中,所有语音样本均经过统一的音素级表音转换,构建为可跨方言对齐的 IPA 前端标注序列。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
DiaMoE-TTS 多方言语音表音数据集 | 数据集 | HyperAI超神经