
摘要
我们提出了一种新的人群计数方法,该方法利用大量可用的未标记人群图像在一个学习排序框架中进行。为了对裁剪的图像进行排序,我们利用了这样一个观察结果:任何拥挤场景图像的子图都必定包含与主图相同数量或更少的人。这使得我们可以解决现有用于人群计数的数据集规模有限的问题。我们通过关键词搜索和基于示例的图像检索两种方式从Google收集了两个拥挤场景数据集。我们展示了如何通过在多任务网络中结合学习排序技术来高效地从这些未标记的数据集中学习,该网络同时对图像进行排序并估计人群密度图。在两个最具挑战性的人群计数数据集上的实验表明,我们的方法取得了最先进的结果。