THCHS30 中文语音数据集

THCHS30是由清华大学语音与语言技术中心(CSLT)出版的开放式中文语音数据库,可以用于中文语音识别系统的开发。该数据集语音数据是在安静的办公室环境下录取的,总时长超过30个小时。采样频率16kHz,采样大小16bits。

Common Voice 英文语音数据集

Common Voice英文数据集是由Common Voice提供,包含39577位测试者参与录音的MP3文件以及相对应的文本文件,总时长为1087小时。参与录音的测试者由不同的口音、年龄、性别等差异,可被用于英文语音识别等任务的研究

Common Voice 中文语音数据集

Common Voice中文数据集是由Common Voice提供,包含288位测试者参与录音的MP3文件以及相对应的文本文件,总时长为12小时。参与录音的测试者由不同的口音、年龄、性别等差异,可被用于中文语音识别等任务的研究