CSS10 是一个拥有十种语言的单扬声器语音的数据集。数据集包含 LibriVox 有声读物的简短音频剪辑及其校准文本。研究人员根据语音数据集还训练了两个由文本生成语音的神经模型,以验证语音数据集质量。数据集未来可用于演讲任务。
CSS10 语音数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 CSS10 语音数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 CSS10 语音数据集!

相关数据集推荐
FSDnoisy18k 音频数据集
FSDnoisy18k 是一个是一个开放的音频数据集。数据集包含共 20 个声音事件类的 42.5 小时音频,包括少量手动标记的数据和大量真实世界的嘈杂数据。音频内容取自 Freesound 。数据集包含 15813 个音频剪辑(38.8 小时)组成的噪声集和由 947 个带有正…

CPED 中文对话数据集
CPED 全称Chinese Personalized and Emotional Dialogue,是第一个大规模的中国个性化和情感对话数据集。数据集由与同理心和个人特征相关的多源知识组成(涵盖了性别、五大个性特征、13 种情感、19 个对话行为和 10 个场景等知识)。 数据…

Music21 音乐视频数据集
Music21 是一个未经修剪的视频数据集,通过关键字从 YouTube 爬取。它包含 21 个类别的音乐表演,数据质量较高,可用于训练和评估视觉声源分离模型 (visual sound source separation model)。
