日期
机构
发布地址
hltsingapore.github.io
许可协议
非商业用途
标签
对话中的情绪识别
语音情绪识别
分类
语音识别
ESD 全称 Emotional Speech Database,是一个用于语音转换研究的情感语音数据集。数据集由 10 个以英语为母语和 10 个以汉语为母语的人说的 350 个平行话语组成,涵盖 5 个情感类别(中性、快乐、愤怒、悲伤和惊讶)。在受控声学环境中记录了超过 29 小时的语音数据。该数据集适用于多语言和跨语言情感语音转换研究。