YouTube-8M 带标签视频数据集

YouTube - 8M 是一个带标签的大型视频数据集,它由数百万个 YouTube 视频 ID 组成,包含的 3800 多个可视化实体注释均由机器基于词汇表生成,预先计算的特点让其可被用于单硬盘,这也意味着使用单 GPU 在该数据集上训练基线模型成为可能。 同时,数据集的规模和…

Google Audioset 音频事件数据集

Google Audioset 是手动注释音频事件的大型数据集,旨在为音频事件检测提供一个通用实际的评估任务,以及全面的声音事件词汇的起点。 它包含了 632 个音频分类样本,并从 YouTube 视频中提取了 2,084,320 个人标记的 10 秒声音片段,该数据集涵盖人类和…

Open Images Dataset 图像数据集

Open Images Dataset 包含约 900 万张标注图片,拥有 6000 个类别的标签,平均每张图像有 8 个标签,其分为包含 9,011,219 张图像的训练集、41,620 张图像的验证集和 125,436 张图像的测试集,它比拥有 1000 个类别标签的 Ima…

Streetview 街景数据集

StreetView Dataset 是 Google 街景数据集,其包含 62058 个高质量街景图像,同时提供了图像的精确 GPS 坐标和罗盘方向,对于每个街景地标均分为 4 个侧视图和 1 个俯视图,且每个坐标拥有附加图像以显示重叠标记。 该数据集由 Google 的 Am…

bAbi 问答和文本理解的数据集

The QA bAbI tasks 是 bAbI 项目中的用于问答和文本理解的训练数据集,其被用于测试文本理解和推理中第一组的 20 个任务,每项任务中均有 1000 个问题用于培训、1000 个问题用于测试。 该数据集由一组上下文组成,基于上下文可以使用多个问答对,目前有以下几…

MNIST 手写数字数据集

MNIST Dataset 是一个手写数字数据集,其包含 60,000 个示例训练集和 10,000 个示例测试集,它主要用于机器视觉领域的图像分类,该数据集中的数字已经过尺寸标准化处理,并以固定尺寸的图像为中心。 MNIST Dataset 由纽约大学库兰特研究所、谷歌纽约实验…