2 个月前
定位、尺寸和计数:通过检测在密集人群中准确识别人员
Deepak Babu Sam; Skand Vishwanath Peri; Mukuntha Narayanan Sundararaman; Amogh Kamath; R. Venkatesh Babu

摘要
我们介绍了一种用于密集人群计数的检测框架,消除了对普遍使用的密度回归范式的依赖。传统的计数模型预测图像中的人群密度,而不是检测每一个人。这些回归方法通常无法准确定位人员,对于大多数除计数以外的应用来说,这是不够的。因此,我们采用了一种架构,该架构可以定位人群中的每一个人,通过边界框来标定检测到的头部大小,然后进行计数。与普通的物体或面部检测器相比,在设计这种检测系统时存在一些独特的挑战。其中一些挑战直接源于密集人群中巨大的多样性以及需要连续预测边界框的需求。我们解决了这些问题,并开发了LSC-CNN模型,该模型能够在从稀疏到密集的各种人群中可靠地检测人的头部。LSC-CNN采用了多列架构并结合自上而下的反馈处理,以更好地解析人员并在多个分辨率下生成精细的预测结果。有趣的是,所提出的训练方案仅需点状头部注释即可估计头部的大致尺寸信息。我们展示了LSC-CNN不仅在定位方面优于现有的密度回归模型,在计数性能上也更为出色。我们的方法代码可在https://github.com/val-iisc/lsc-cnn 获取。