OpenEDS 全称 Open Eye Dataset,是一个大规模的眼球图像数据集,图像由使用 VR 头盔安装的眼控摄像头采集。Facebook希望通过此数据集的开放促进虚拟现实领域的技术发展。 该数据集包含从 152 名受试者的眼部视频中随机选择了 12,759 张图像进行像…
机构: Facebook
TextCaps 文字识别数据集
TextCaps 是一个主要用于图像中的文字识别的数据集。该数据集包含 28,408 张图像及 142,040 条描述。数据集要求模型识别图像中的文本,以决定文本中需要复制或释义的地方。
SIMMIC 情景交互多模态对话数据集
SIMMIC 全称 Situated and Interactive Multimodal Conversations,是一个情景交互多模态对话数据集,包含两个 SIMMC 数据集,共计 13,000 人类对话框、16.9 万句话,通过多模态 Wizard-of-Oz (WoZ)…
EasyCom 增强现实数据集
EasyCom 全称 Easy Communications,是一个增强现实数据集,可用于在嘈杂环境中轻松通信的算法。该数据集包含超过 5 小时的多模态数据,可用于训练和测试算法,以改善 AR 眼镜佩戴者的对话。 该数据集包含 AR 眼镜、以自我为中心的多通道麦克风阵列音频、宽视…
Casual Conversations 语音识别数据集
Casual Conversations 旨在帮助研究人员评估其计算机视觉和音频模型在各种年龄、性别、明显的肤色和周围光线条件下的准确性,以消除 AI 偏见。 该数据集包含了 3,011 名参与者的 45,000 多个视频,均匀分布了不同的性别、年龄段和肤色。 Facebook …
HM3D 3D 室内场景数据集
HM3D 全称 Habitat-Matterport 3D,是一个交互式 3D 室内场景数据集,包含 1,000 个来自不同现实世界地点的建筑规模 3D 重建。该数据集中的每一个场景都由内部的带纹理的 3D 网格重建组成,如:多层住宅、商店和其他私人室内空间。
DFDC deepfake 检测数据集
DFDC 全称 Deepfake Detection Challenge,是一个用于 deepfake 检测的数据集,由 10 万多个视频组成。 DFDC 数据集由两个版本组成: 预览数据集。包含 5k 个视频,两种面部修改算法。完整数据集,包含 124k 视频,八种面部修改算法…
Hateful Memes 多模式仇恨言论数据集
Hateful Memes 是一个用于仇恨言论检测的多模态数据集(图像+文本)。该数据集包含了 Facebook AI 创建的 10,000 多个新的多模态实例。图片由 Getty Images 授权。 数据集中增加了难以识别的例子,使其难以依赖单峰信号,这意味着只有多峰模型才能…
Replica 室内场景三维重建数据集
Replica 是一个高质量室内场景三维重建数据集,包含了 18 个高真实感的室内场景。 每个场景由一个密集的网格、高分辨率高动态范围(HDR)纹理、玻璃和镜子表面信息 (glass and mirror surface information)、语义类别和实例分割组成。该数据集…
LVIS 词汇实例分割数据集
LVIS 全称 Large Vocabulary Instance Segmentation,是一个用于长尾实例分割的数据集。该数据集对 164k 图像中的 1000 多个目标类别进行了标注,提供了 200 万个高质量的实例分割 mask。 由于自然图像类别的齐夫定律分布,LVI…
The Children’s Book Test 问答数据集
CBT 数据集由文字段落和相应问题构建,问答数据均来自古腾堡项目免费提供的书籍,该数据集用于直接测量语言模型、更广泛的语言环境用于问答和仿真查找。 CBT 数据集由 Facebook 于 2016 年发布,主要发布人有 Felix Hill、Antoine Bordes、Sumi…
bAbi 问答和文本理解的数据集
The QA bAbI tasks 是 bAbI 项目中的用于问答和文本理解的训练数据集,其被用于测试文本理解和推理中第一组的 20 个任务,每项任务中均有 1000 个问题用于培训、1000 个问题用于测试。 该数据集由一组上下文组成,基于上下文可以使用多个问答对,目前有以下几…