3 个月前

基于元策略与显式定位推理的即时响应少样本目标检测

Junying Huang, Fan Chen, Sibo Huang, Dongyu Zhang
基于元策略与显式定位推理的即时响应少样本目标检测
摘要

针对仅凭少量参考样本识别并定位新类别物体的任务,少样本目标检测(Few-Shot Object Detection, FSOD)是一项极具挑战性的任务。以往的方法通常依赖微调(fine-tuning)过程将模型迁移到新类别,却很少考虑微调本身存在的缺陷,导致在实际应用中存在诸多问题。例如,在需要频繁更换测试样本(episode-changeable)的场景下,由于微调次数过多,性能难以满足需求;同时,当支持集(support set)质量较低(如样本数量极少或类别不完整)时,这些方法的检测性能会显著下降。为此,本文提出一种无需微调过程、能够实现快速响应的少样本目标检测器——即时响应少样本目标检测器(Instant Response Few-Shot Object Detector, IR-FSOD),可直接、准确地检测新类别物体。为实现该目标,本文系统分析了在FSOD设定下Faster R-CNN框架中各模块存在的缺陷,并在此基础上对其进行改进,构建出IR-FSOD框架。具体而言,首先针对候选框分类器(box classifier)和区域建议网络(RPN)模块,提出两种简单而有效的元学习策略(meta-strategies),使模型能够在无需微调的情况下实现对新类别的即时响应检测。其次,在定位模块中引入两种显式推理机制,以缓解模型对基础类别(base categories)的过拟合问题,包括显式定位得分(explicit localization score)和半显式边界框回归(semi-explicit box regression)。大量实验结果表明,IR-FSOD框架不仅实现了无需微调的即时响应少样本目标检测,而且在多种FSOD设置下均达到了当前最优的检测精度与召回率,显著提升了少样本场景下的检测性能与实用性。

基于元策略与显式定位推理的即时响应少样本目标检测 | 论文 | HyperAI超神经