17 天前
BigDetection:面向改进目标检测器预训练的大规模基准数据集
Likun Cai, Zhi Zhang, Yi Zhu, Li Zhang, Mu Li, Xiangyang Xue

摘要
近年来,多个数据集和开放性挑战任务相继被提出,推动了目标检测领域的发展。为构建更具通用性与强大性能的目标检测系统,本文提出一个全新的大规模基准数据集——BigDetection。我们的目标是通过精心设计的原则,简单地利用现有数据集(LVIS、OpenImages 和 Object365)中的训练数据,构建一个规模更大的数据集,以提升检测器的预训练效果。具体而言,我们构建了一个新的分类体系,统一了来自不同来源的异构标签空间。BigDetection 数据集包含 600 个物体类别,涵盖超过 340 万张训练图像和 3600 万个边界框,其规模在多个维度上均显著超越以往基准数据集,既带来了新的机遇,也提出了更高的挑战。大量实验验证了 BigDetection 作为评估各类目标检测方法的新基准的有效性,同时也证明了其在预训练任务中的卓越性能。