InterHand2.6M 是一个基于单幅RGB图像的三维交互式手部姿态估计数据集。该数据集包含准确的 GT 3D 手部交互姿势,用于三维手部姿态估计。数据集包含 2.6M 已标注的单个和交互的手部姿态框架。
机构: Seoul National University
Refer-YouTube-VOS 视频分割数据集
Refer-YouTube-VOS 是基于 Youtube-VOS 数据集建立的第一个视频分割数据集,即通过 video + caption 来执行分割。该数据集从视频中识别独特对象,每个目标对象被用两种方式进行了标注。
GoPro 模糊图像数据集
GoPro 数据集是一个用于去模糊任务的数据集。 该数据集包括 3,214 张大小为 1,280×720 的模糊图像,其中 2,103 张是训练图像, 1,111 张是测试图像。该数据集由一一对应的真实模糊图像与 ground truth 图像组成,均由高速摄像机拍摄。