PISC 社会关系图像数据集

PISC 全称 People in Social Context,是一个关于社会关系的图像数据集,包含 9 类社会关系的 22,670 张图像和 76,568 个标注样本。图像中的人物都标注了边界框、人物间的社会关系以及职业信息。该数据集用于研究在静止图像中识别社会关系这一领域。

MHP 多人解析数据集

MHP 全称 Multiple-Human Parsing,是关于多人解析的图像数据集。数据集中每张图像都包含自然场景下的多个人物,并且存在多个人物形象交互、遮挡等情况,因而更加贴合实际的应用。该数据集带有像素级的细粒度语义标注。该数据集可用于研究开发新的多人解析模型。

ESD 情感语音数据集

ESD 全称 Emotional Speech Database,是一个用于语音转换研究的情感语音数据集。数据集由 10 个以英语为母语和 10 个以汉语为母语的人说的 350 个平行话语组成,涵盖 5 个情感类别(中性、快乐、愤怒、悲伤和惊讶)。在受控声学环境中记录了超过 29…

NUS-WIDE 网络图像数据集

NUS-WIDE 全称 a real-world web image database from National University of Singapore,这是一个由新加坡国立大学媒体搜索实验室创建的带有多标签的网络图像数据集。该数据集可促进提高现有图像标注和检索方法的性…