
摘要
在自然场景中进行常见物体计数是计算机视觉领域的一个具有挑战性的问题,拥有广泛的实际应用。现有的图像级监督常见物体计数方法仅能预测全局物体数量,并依赖额外的实例级监督来确定物体位置。我们提出了一种图像级监督方法,通过构建物体类别密度图,同时提供全局物体数量和物体实例的空间分布。受心理学研究的启发,我们进一步利用有限的物体数量信息(最多四个)减少了图像级监督的需求。据我们所知,这是首次提出用于常见物体计数的图像级监督密度图估计方法,并展示了其在图像级监督实例分割中的有效性。我们在PASCAL VOC和COCO数据集上进行了全面的实验。结果表明,我们的方法在这两个数据集上的常见物体计数性能优于现有方法,包括那些使用实例级监督的方法。此外,我们的方法在PASCAL VOC 2012数据集上通过平均最佳重叠度指标相对提升了17.8%,改进了最先进的图像级监督实例分割技术。代码链接:https://github.com/GuoleiSun/CountSeg