Argoverse-HD 流媒体物体检测数据集

日期

6 个月前

机构

发布地址

mtli.github.io

许可协议

其他

下载帮助
特色图像

Argoverse-HD 是一个关于流媒体物体检测的数据集,包括实时物体检测、视频物体检测、跟踪和短期预测。该数据集包含了 Argoverse 1.1 的视频数据,总共有 7 万个图像帧和 130 万个边界框,这些视频具有 MS COCO 风格的标注和轨迹 ID,分辨率为 1920 x 1200 @ 30 FPS 。这些标注与 COCO 是向后兼容的,因此研究人员可以在这个数据集上直接评估 COCO 预训练模型,进而估计模型的效率或跨数据集泛化能力。

Argoverse-HD 是用于流感知挑战赛的数据集,其中包括两个赛道:

  • 单一检测(实时物体检测):在这个赛道上,参赛者将开发单帧物体检测器,类似于 COCO 和 LVIS 挑战。关键的区别是评估将通过流媒体的准确性对延迟进行评分。
  • 全堆栈:在这个赛道上,方法是不受限制的。然而最有可能的是,跟踪和预测将被用来补偿探测器的延迟。

默认情况下,所有提交的文件都由 V100 GPU 的官方工具包测量其延迟。