PathTrack 人物追踪数据集

PathTrack 是一个用于人物追踪的视频数据集,包含 720 个视频序列和 15,000 多条人物轨迹。该数据集采用了新的路径监督方法,标注者在观看视频时用光标跟踪目标对象,为每个对象提供路径标注。该数据集可用于改善追踪器 NOMT 的性能和研究多目标跟踪(MOT)领域。

Nighttime Driving 夜间驾驶数据集

Nighttime Driving 数据集由夜间和黄昏时的真实驾驶场景图像组成,包括 35,000 张未标注图像和 50 张密集标注的图像。该数据集有助于学习和评价夜间驾驶场景的语义分割方法。

ETH 行人检测数据集

ETH 全称 Eidgenössische Technische Hochschule Zürich,是一个用于行人检测的图像数据集。这些图像由安装在汽车上的 AVT Marlins F033C 拍摄,分辨率为640×480(bayered),帧速率为13—14 FPS。数据集的…

DHP19 人体姿态估计数据集

DHP19 是一个从DVS 事件相机搜集的 3D 人体姿态的数据集。该数据集使用 4 个不同位置的事件相机,每个不同位置的事件相机的输出均被记录,同时使用运动捕捉系统得到人体运动的真实姿态。3D 坐标是从 Vicon 中提取的,而 2D 坐标是手动标注的。 该数据集记录了 17 …

EVE 眼动追踪数据集

EVE 全称 End-to-end Video-based Eye-tracking,是一个用于眼动追踪的数据集。该数据集收集自 54 名参与者,包括 4 个摄像头视图,包含超过 1,200 万帧的约 105 小时的视频数据,涵盖 1,327 个独特的视觉刺激(图像、视频、文本)…

Global Wheat 麦穗检测数据集

Global Wheat 全称 Global Wheat Head Dataset 2020,是第一个用于从现场光学图像中检测小麦头的大规模数据集,包括来自不同大陆的大量品种。 该数据集包含 4,700 张高分辨率的 RGB 图像和 190,000 个标注的小麦头。这些图像是从几…

Video2GIF 动图数据集

Video2GIF 包含超过 100,000 个 GIF-视频对。这些 GIF 收集自两个流行的 GIF 网站 (Makeagif.com、Gifsoup.com),相应的源视频收集自 2015 年夏季的 YouTube。该视频提供了 GIF 和视频的 ID 和 URL,以及 G…

WebVison 1.0+2.0 图像分类数据集

WebVision 数据集是一个大规模的网络图像数据集,包含 240 多万张从 Flickr 网站和 Google Image 搜索中爬取的图像。图像的对应文本信息(如:标题、用户标签或描述)也作为额外的元信息提供。该数据集提供一个包含 5 万张图片(每个类别 50 张)的验证集…

SumMe 视频摘要数据集

SumMe 是一个视频摘要数据集,由 25 个视频组成,每个视频至少有 15 个人为标注,共有 390 个标注。 数据由视频、标注和评价指标组成。Ground truth是一种新的评价范式,因为它源于心理学实验,可以进行一致的自动评价,不需要在每次获得新摘要结果时都进行用户研究。

TSR 比利时交通标志数据集

TSR 全称 Traffic Sign Recognition,是一个交通标志数据集,包括了比利时法兰德斯地区数以千计的实体交通标志,这些图像主要来自小路或街道,因此标志更小、更旧,容易被涂鸦或遮挡,因此更具有挑战性。该数据集可用于解决交通标志的检测和分类等问题。 示例图像:

DAVIS 目标分割数据集

Densely Annotation Video Segmentation dataset (DAVIS) 是一个高质量、高分辨率的视频目标分割数据集,包括 480p 和 1080p 两种分辨率。该数据集包括 50 个视频,在像素层面包含 3,455 密集标注的帧。其中,训练集包…