
摘要
本文旨在解决一项具有挑战性的单次样本目标计数任务。给定一张包含新型、此前未见类别物体的图像,该任务的目标是仅通过一个支持性边界框示例,准确统计出目标类别中所有实例的数量。为此,我们提出了一种名为“仅需观察一个实例”(Look At One instance, LaoNet)的计数模型。首先,我们设计了一个特征相关性模块,融合了自注意力(Self-Attention)与相关注意力(Correlative-Attention)机制,以同时学习实例内部的内在关系与实例之间的相互关系,从而提升网络对不同实例间旋转角度与尺度不一致性的鲁棒性。其次,我们引入了一种尺度聚合(Scale Aggregation)机制,有效提取具有多尺度信息的特征表示。与现有少样本计数方法相比,LaoNet 在实现卓越性能的同时,还展现出极高的收敛速度。相关代码即将开源。