
摘要
本文解决了图像中的目标计数问题。现有的方法依赖于大量带有每个目标点注释的训练数据,这使得数据收集既费力又耗时。为了解决这一问题,我们提出了一种无需训练的目标计数器,将计数任务视为分割问题。我们的方法利用了知名的Segment Anything Model(SAM),该模型以其高质量的掩码和零样本分割能力而著称。然而,SAM的基本掩码生成方法在掩码中缺乏类别特定信息,导致计数精度较低。为了克服这一局限性,我们引入了一种先验引导的掩码生成方法,该方法在分割过程中融入了三种类型的先验信息,从而提高了效率和准确性。此外,针对通过文本指定目标的计数问题,我们提出了一种两阶段的方法,结合参考目标选择和先验引导的掩码生成技术来解决。我们在标准数据集上进行了广泛的实验,结果表明我们的无训练计数器在性能上与基于学习的方法具有竞争力。本文提供了一种有前景的解决方案,在各种场景下进行目标计数时无需大量的数据收集和专门的计数训练。代码可在\url{https://github.com/shizenglin/training-free-object-counter}获取。