Command Palette
Search for a command to run...
DiaMoE-TTS 多方言语音表音数据集
DiaMoE-TTS 是由清华大学联合巨人网络于 2025 年发布的一个面向多方言文本到语音合成(TTS)任务的语音数据集,相关论文成果为「DiaMoE-TTS: A Unified IPA-Based Dialect TTS Framework with Mixture-of-Experts and Parameter-Efficient Zero-Shot Adaptation」,旨在构建统一的方言语音表音体系,支持多方言之间的可迁移语音建模与零样本方言合成研究。
该数据集基于多个开源方言语音资源构建,采用 IPA(国际音标)作为统一表音体系,用于对不同方言语料进行一致的音系标注。数据集的语音来源包括 Common Voice 粤语数据集、 Emilia 普通话语料、 KeSpeech 语料库中的方言语音,以及开源的闽南语语音数据集。在数据处理过程中,所有语音样本均经过统一的音素级表音转换,构建为可跨方言对齐的 IPA 前端标注序列。