
摘要
在拥挤场景中进行行人检测是一个具有挑战性的问题,因为行人经常聚集在一起并相互遮挡。本文提出了一种新的遮挡感知R-CNN(OR-CNN),以提高在人群中的检测精度。具体而言,我们设计了一种新的聚合损失函数,以强制候选框靠近并紧密定位到相应的物体上。同时,我们引入了一种新的部分遮挡感知感兴趣区域(PORoI)池化单元来替代RoI池化层,以便将人体结构的先验信息与可见性预测整合到网络中,从而处理遮挡问题。我们的检测器采用端到端的方式进行训练,在CityPersons、ETH和INRIA三个行人检测数据集上取得了最先进的结果,并且在Caltech数据集上的表现也与当前最佳方法相当。