Cityscapes-VPS 是 Cityscapes 数据集验证集的一个视频扩展。该数据集提供了 2,500 帧全景标签 (panoptic label),将 Cityscapes 数据集原有的 500 个图像全景标签扩展到 3,000 个,这些全景标签对应于每 500 个视频的第 5、第 10、第 15、第 20、第 25 和第 30 帧,其中所有的实例 ID 都是随时间变化的。
该数据集不仅支持视频全景分割 (video panoptic segmentation, VPS) 任务,而且还为视频语义分割 (video semantic segmentation, VSS) 和视频实例分割 (video instance segmentation, VIS) 任务提供了 super-set 标注。