FAIR-Play 是一个音视频数据集,由 1,871 个视频剪辑及其在音乐室中录制的相应的双耳音频剪辑组成。该数据集是第一个通过专业 3Dio Binaural Mic 和 GoPro 采集的立体声与视觉对齐的数据集。
FAIR-Play 音视频数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 FAIR-Play 音视频数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 FAIR-Play 音视频数据集!

相关数据集推荐
CSS10 语音数据集
CSS10 是一个拥有十种语言的单扬声器语音的数据集。数据集包含 LibriVox 有声读物的简短音频剪辑及其校准文本。研究人员根据语音数据集还训练了两个由文本生成语音的神经模型,以验证语音数据集质量。数据集未来可用于演讲任务。

FSDnoisy18k 音频数据集
FSDnoisy18k 是一个是一个开放的音频数据集。数据集包含共 20 个声音事件类的 42.5 小时音频,包括少量手动标记的数据和大量真实世界的嘈杂数据。音频内容取自 Freesound 。数据集包含 15813 个音频剪辑(38.8 小时)组成的噪声集和由 947 个带有正…

CPED 中文对话数据集
CPED 全称Chinese Personalized and Emotional Dialogue,是第一个大规模的中国个性化和情感对话数据集。数据集由与同理心和个人特征相关的多源知识组成(涵盖了性别、五大个性特征、13 种情感、19 个对话行为和 10 个场景等知识)。 数据…
