17 天前
WiderPerson:野外密集行人检测的多样化数据集
Shifeng Zhang, Yiliang Xie, Jun Wan, Hansheng Xia, Stan Z. Li, Guodong Guo

摘要
行人检测在现有基准数据集可用的背景下已取得显著进展。然而,现实世界需求与当前行人检测基准数据集之间仍存在多样性与密度方面的差距:1)现有大多数数据集源自车辆在常规交通场景中的拍摄,通常导致场景多样性不足;2)高密度遮挡人群场景仍严重缺失,致使数据集整体密度偏低。为缩小这一差距并推动未来行人检测研究的发展,我们提出一个大规模、多样化的数据集——WiderPerson,专用于野外环境下的密集行人检测。该数据集涵盖五类标注,覆盖广泛多样的场景,不再局限于交通场景。数据集共包含13,382张图像,共计399,786个标注,平均每张图像包含29.87个标注,表明该数据集包含大量存在各类遮挡的密集行人。因此,所提出的WiderPerson数据集中的行人具有极高的挑战性,其场景变化多样且遮挡情况复杂,非常适合用于评估真实环境下行人检测器的性能。我们引入改进的Faster R-CNN与原始的RetinaNet作为新基准数据集的基线模型。为进一步验证所提数据集的泛化能力,我们在Caltech-USA和CityPersons等先前数据集上进行了多项实验,结果表明,仅使用标准训练流程(无额外技巧),即可在这些已有数据集上达到当前最优(SOTA)性能。最后,我们对常见误检与漏检案例进行了分析,发现行人检测器的分类能力仍有待提升,以有效降低误报率与漏检率。所提出的WiderPerson数据集已公开,访问地址为:http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson