YouTube-100M 视频分类数据集 机构 Google (谷歌) 发布地址 arxiv.org 论文地址 arxiv.org 分类 音乐信息检索 许可协议 其他 发布日期 1 年前 标签 视频分类、音乐信息检索、音频分类 暂无下载 本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用) 感谢您下载 YouTube-100M 视频分类数据集! 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。 感谢您下载 YouTube-100M 视频分类数据集! 点击前往百度网盘下载页面 本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。 关注公众号,获取数据集更新、人工智能相关的最新资讯 YouTube-100M 数据集包含 1 亿个 YouTube 视频。其中包括 7,000 万个训练视频,1,000 万个评估视频,以及 2,000 万个验证视频。每个视频平均 4.6 分钟,总共有 540 万个训练小时。 该数据集涵盖超过 30K 个类别标注,标注是根据每个视频的元数据(标题、描述、评论等)、背景和图像内容的组合自动生成的。每个视频平均大约有 5 个标注。 相关数据集推荐 WLD 动物目标检测数据集 3 个月前 WLD 全称 WildLife Documentary,是一个用于动物目标检测的数据集。该数据集包含从 YouTube 下载的 15 部纪录片,其时长从 9 分钟到长达 50 分钟不等,并且总帧数超过 747,000。该数据集标注了 65 个类别的 4,000 多个对象的轨迹。该… CSS10 语音数据集 11 个月前 CSS10 是一个拥有十种语言的单扬声器语音的数据集。数据集包含 LibriVox 有声读物的简短音频剪辑及其校准文本。研究人员根据语音数据集还训练了两个由文本生成语音的神经模型,以验证语音数据集质量。数据集未来可用于演讲任务。 FSDnoisy18k 音频数据集 11 个月前 FSDnoisy18k 是一个是一个开放的音频数据集。数据集包含共 20 个声音事件类的 42.5 小时音频,包括少量手动标记的数据和大量真实世界的嘈杂数据。音频内容取自 Freesound 。数据集包含 15813 个音频剪辑(38.8 小时)组成的噪声集和由 947 个带有正…