15 天前
面向判别性与可迁移性的单阶段少样本目标检测器
Karim Guirguis, Mohamed Abdelsamad, George Eskandar, Ahmed Hendawy, Matthias Kayser, Bin Yang, Juergen Beyerer

摘要
近期的目标检测模型在训练新类别对象时,通常需要大量标注数据。少样本目标检测(Few-shot Object Detection, FSOD)旨在通过仅提供少量样本即可学习新类别,从而缓解这一问题。尽管两阶段FSOD检测器已取得具有竞争力的性能,但通常情况下,一阶段FSOD检测器的表现仍显著逊色于前者。我们观察到,两阶段与一阶段FSOD之间性能差距的主要原因在于前者在判别能力上的不足,这可归因于融合后感受野较小以及损失函数中前景样本数量有限。为解决上述局限,我们提出了一种新型少样本RetinaNet(Few-shot RetinaNet, FSRN),其核心包含以下三个关键设计:(1)多路支持样本训练策略,用于扩充密集元检测器的前景样本数量;(2)早期多层级特征融合机制,构建覆盖整个锚框区域的宽感受野;(3)针对查询图像与源图像的两种增强技术,以提升模型的迁移能力。大量实验表明,所提出的方法有效缓解了上述缺陷,显著提升了模型的判别能力与迁移性能。在保持与两阶段FSOD相当精度的同时,FSRN的推理速度几乎提升一倍,且在MS-COCO和PASCAL VOC基准测试上,其性能超越了当前最优的一阶段元检测器,甚至在部分指标上优于部分两阶段FSOD方法。