
摘要
我们研究了在图像中对任意语义类别进行少量样本(低样本)计数的问题,仅使用少数标注示例(少样本)或不使用任何示例(零样本)。传统的少样本流程包括从示例中提取外观查询,并将其与图像特征匹配以推断物体数量。现有方法通过特征池化提取查询,这忽略了形状信息(例如,大小和长宽比),导致物体定位精度降低和计数估计不准确。为此,我们提出了一种具有迭代原型适应功能的低样本物体计数网络(LOCA)。我们的主要贡献在于新的物体原型提取模块,该模块通过迭代融合示例的形状和外观信息与图像特征来提高准确性。该模块可以轻松适应零样本场景,从而使LOCA能够涵盖整个低样本计数问题的范围。在FSC147基准测试中,LOCA在单样本和少样本任务上的均方根误差(RMSE)比最近的所有先进方法提高了20-30%,并在零样本场景中达到了最先进的水平,同时展示了更好的泛化能力。