GOT-10k 数据集

GOT-10k 是一个基于 WordNet 的大型目标跟踪数据集,广泛覆盖了 560 类户外常见的移动物体,物体的边界框全部由人工标注,边界框数量超过 150 万,实现了深度跟踪器的统一训练和稳定评估。 该数据集具有以下特点:规模宏大(Large-Scale)、通用类(Gener…

YouTube-8M 带标签视频数据集

YouTube - 8M 是一个带标签的大型视频数据集,它由数百万个 YouTube 视频 ID 组成,包含的 3800 多个可视化实体注释均由机器基于词汇表生成,预先计算的特点让其可被用于单硬盘,这也意味着使用单 GPU 在该数据集上训练基线模型成为可能。 同时,数据集的规模和…

VOT2016 目标跟踪数据集

VOT 2016 Dataset 是被用于 2016 年 VOT 挑战的数据集。 VOT 挑战由 Open Challenges 组织,旨在为跟踪社区提供可精确定义和可重复的方式比较长短期跟踪器,并为视觉跟踪领域的评估和进展提供平台,该挑战的目的是建立相当基准的储存库,并组织研讨…

Monocular Multiview Object Tracking with 3D Aspect Parts

Monocular Multiview Object Tracking with 3D Aspect Parts Dataset 被用于研究视点变化下跟踪对象的问题,其中包括视点变化、汽车跟踪标准序列等。 该数据集中发布者提出新的方法,主要用于跟踪物体、估计严重视点变化下的连续姿…

Stanford Drone 无人机视频图像数据集

Stanford Drone Dataset 是由各类行人的图像和视频组成的大型数据集,涵盖拥挤空间中的八种场景,例如大学校园或繁忙街道的人行道。 人类在大学校园、人行道等环境行走时会遵循一定的准则,该数据集旨在设计一套新算法以解决目标跟踪、轨迹预测等任务。 Stanford D…

Udacity 图片数据集

Udacity Dataset 是一套带注释的图片数据集,主要用于自动驾驶,其包含的两个子数据集分别有 9423 和 15000 张图片,分辨率均为 1920 * 1200。 该数据集是 2016 年 Udacity 为自动驾驶算法比赛准备的,其对连续视频图片进行了仔细标注,主要…

Comma.ai 自动驾驶视频数据集

Comma.ai Dataset 是一个用于自动驾驶的视频数据集,其包含共计 7.25 小时的视频,该数据集包含 10 个以 20Hz 频率记录的视频,这些视频均由安装在 Acura ILX 2016 挡风玻璃上的相机录制。 除此之外,该数据集还包含一些测量值,如汽车时速、加速度…

Oxford RobotCar 自动驾驶计算机视觉数据集

Oxford RobotCar Dataset 是由汽车摄像头拍摄的照片组成的数据集,主要呈现英国牛津同一条路线在一年内的变化,包含不同天气、交通和行人的组合,以及建筑和道路工程的变化。 Oxford RobotCar 数据集由牛津机器人研究所于 2016 年发布,相关论文有《1…

KITTI 计算机视觉算法评测数据集

KITTI 是一套计算机视觉算法评测数据集,其主要用于自动驾驶场景下的相关测试,评测种类涵盖立体图像、光流、视觉测距、3D 物体检测和 3D 追踪等。KITTI 包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像有最多 15 辆车和 30 个行人,并且拥有不同程度的遮挡和…

DTB70 基准视频数据集

DTB70 Dataset 是一个高多样性基准视频数据集,其被用于解决视觉跟踪领域中运动模型的研究,该数据集由 70 多个无人机拍摄的视频组成。 DTB70 数据集由香港科技大学·计算机科学与工程系的 Siyi Li 和 Dit-Yan Yeung 发布,相关论文有《Visual…

Dataset-UAV-123 视频数据集

Dataset-UAV-123 是由低空无人机捕获视频组成的数据集,这与 OTB50、VOT2014 等主流跟踪数据集中的视频存在本质区别,该数据集的子集被用于长期空中跟踪,其包含共计 123 个视频序列以及超过 110k 帧,它也是 ALOV 300++ 之后的第二大对象跟踪数…