
摘要
遮挡问题在行人检测中极具挑战性。本文提出了一种简单而有效的检测方法——V2F-Net,该方法显式地将遮挡行人检测任务分解为可见区域检测与完整身体框估计两个子任务。V2F-Net由两个子网络构成:可见区域检测网络(Visible Region Detection Network, VDN)和完整身体估计网络(Full Body Estimation Network, FEN)。VDN负责定位行人可见区域,而FEN则基于可见区域框来估计完整的行人边界框。此外,为进一步提升完整身体的估计精度,本文提出了一种新型的基于嵌入的部件感知模块(Embedding-based Part-aware Module, EPM)。该模块通过监督每个身体部件的可见性,促使网络提取蕴含关键部件信息的特征表示。通过在两个具有挑战性的数据集上开展的多项实验,我们验证了V2F-Net的有效性。相较于FPN基线模型,V2F-Net在CrowdHuman数据集上实现了5.85%的AP提升,在CityPersons数据集上实现了2.24%的MR-2性能改进。此外,该方法在单阶段与双阶段检测器上均表现出一致的性能增益,充分验证了其良好的通用性。