EgoGesture 手势识别数据集

EgoGesture 是一个大规模识别手势的数据集。该数据集规模大、富于变化且具有极高真实性,能够训练深度神经网络。数据集用于以自我为中心的手势识别。该数据集不仅为分段数据中的手势分类提供测试台,还用于连续数据中的手势检测。 数据集包括: 2,081 个 RGB-D 视频2,41…

WoodScape 自动驾驶鱼眼数据集

WoodScape 是一个自动驾驶鱼眼图像数据集,该数据集包括四台环绕视图相机和九项任务(包括分割、深度估计、3D bounding box 检测和 soiling detection),在实例级别为 1 万多张图像提供了 40 类的语义标注,为超过 10 万张图像提供了其他任务…

G3D 动作识别数据集

G3D 全称 Gaming 3D Dataset,是一个游戏动作 3D 数据集。该数据集专注于游戏场景中的实时动作识别。它包含 10 个主题,执行 20 个游戏动作:“punch right”, “punch left”, “kick right”, “kick left”, “…

URMP 音乐表演视听分析数据集

URMP 全称 University of Rochester Multi-Modal Musical Performance,是一个用于音乐表演视听分析的数据集。该数据集包括 44 首简单的多乐器音乐作品,由单个曲目单独录制的表演成。对于每首作品,数据集都提供了 MIDI 格式…

Dark Zurich 语义分割数据集

Dark Zurich 是一个图像数据集,包含在夜间、黄昏、白天拍摄的共计 8,779 张图像,以及每张图像对应的相机 GPS 坐标。这些 GPS 标注可用于构建具有时间跨度的对应,如将夜晚或黄昏时拍摄的图像,与白天对应的图像进行匹配。 这些属性使得 Dark Zurich 数据…

AffectNet 大型面部表情数据集

AffectNet 是一个大型面部表情数据集。该数据集用 6 种语言、1250 个情绪相关的关键词,在 3 大搜索引擎中收集了 100 多万张面部图像,其中约 44 万张图像手动标注了 7 种表情(分类模型)以及 valence 和 arousal 的强度(维度模型)。 此数据集…

Places 205 场景数据集

这是一个大规模的以场景为中心的图像数据集,具有 205 个常见场景类别,250 万张图像,主要用于场景识别。 该数据集包括: 训练集:每类最少 5,000 张,最多 15,000 张,共 2,479,500 张验证集:每类 100 张,共 20,500 张测试集:每类 200 张…