
摘要
我们致力于解决一项新的少样本目标计数和检测任务。给定目标对象类别的少量示例边界框,我们的目标是计数并检测出所有属于该类别的对象。这项任务与少样本目标计数具有相同的监督信息,但除此之外还输出每个对象的边界框以及总的目标数量。为了解决这一具有挑战性的问题,我们引入了一种新颖的两阶段训练策略和一种新的不确定性感知少样本目标检测器:Counting-DETR。前者旨在生成伪真实边界框以训练后者,而后者则利用前者提供的伪真实边界框,同时采取必要措施来弥补伪真实边界框的不完美之处。为了验证我们在新任务上的方法性能,我们引入了两个新的数据集,分别命名为FSCD-147和FSCD-LVIS。这两个数据集包含复杂场景的图像,每幅图像中有多类目标,并且目标在形状、大小和外观上存在巨大差异。我们的提出的方案在计数和检测指标上均大幅优于从少样本目标计数和少样本目标检测改编的强大基线方法。代码和模型可在https://github.com/VinAIResearch/Counting-DETR 获取。