AISHELL-DMASH 中文普通话麦克风阵列家居场景语音数据库

日期

10 个月前

机构

下载帮助

AISHELL-DMASH 数据集是在两个不同房间的真实智能家居场景中记录的,该数据集包含 30000 小时的语音数据。录音设备包括一个近距离麦克风和位于房间 7 个不同位置的 7 组设备。一组录音设备包括一部 iPhone 、一部 Android 手机、一部 iPad 、一个麦克风以及一个半径为 5cm 的圆形麦克风阵列。该数据集包含 511 位说话者,每个说话者访问 3 次,间隔 7-15 天。 AISHELL-DMASH 数据集由专业语音标注人员转录,单词准确率达 98%,可用于声纹识别、语音识别、唤醒词识别等研究。