
摘要
基准测试(如 COCO)在目标检测领域中发挥着至关重要的作用。然而,现有的基准测试在尺度变化方面仍显不足,且其评估协议难以实现公平比较。为此,本文提出通用尺度目标检测基准(Universal-Scale object detection Benchmark,简称 USB)。USB 通过整合 COCO 数据集与近期提出的 Waymo Open Dataset 及 Manga109-s 数据集,实现了对象尺度和图像领域上的多样化。为促进公平比较与包容性研究,我们设计了一套训练与评估协议。该协议采用类似体育竞赛中“权重级别”的多级划分机制,对训练轮次(epochs)和评估图像分辨率进行分级,并具备类似通用串行总线(USB)的向后兼容特性,确保不同训练协议之间的互操作性。具体而言,我们要求参赛者不仅报告在较高协议(更长训练周期)下的结果,也需提供在较低协议(较短训练周期)下的表现。基于所提出的基准与协议,我们使用 15 种方法开展了大量实验,揭示了现有以 COCO 为中心的方法在泛化能力上的固有缺陷。相关代码已开源,地址为:https://github.com/shinya7y/UniverseNet。