16 天前

可泛化的行人检测:房间里的大象

Irtiza Hasan, Shengcai Liao, Jinpeng Li, Saad Ullah Akram, Ling Shao
可泛化的行人检测:房间里的大象
摘要

行人检测广泛应用于各类基于视觉的应用场景,从视频监控到自动驾驶系统。尽管现有检测器在特定数据集上已达到较高性能,但其在未见数据上的泛化能力仍不明确。这一点至关重要,因为实际应用中的检测器需具备在多种场景下直接部署的能力。为此,本文基于“直接跨数据集评估”这一通用原则,开展了一项全面研究。研究发现,尽管当前最先进的行人检测器在同数据集训练与测试下表现优异,但在跨数据集评估中却表现出较差的泛化性能。我们揭示出这一现象背后的两个主要原因:其一,现有检测器的设计(如锚框设置)往往偏向于传统单数据集训练与测试范式中的主流基准,导致其泛化能力受到显著限制;其二,训练数据在行人密度和场景多样性方面普遍不足。令人意外的是,在直接跨数据集评估中,我们发现一种无需针对行人任务进行专门设计的通用目标检测器,其泛化性能显著优于当前最先进的行人检测器。此外,本文进一步表明,通过网络爬取方式构建的多样化且高密度的数据集,可作为行人检测任务高效预训练的优质数据源。基于此,我们提出了一种渐进式训练流程,并验证其在面向自动驾驶的行人检测任务中具有良好的有效性。综上所述,本研究建议未来在设计具备强泛化能力的行人检测器时,应更加重视跨数据集评估的指导作用。相关代码与模型已开源,可通过 https://github.com/hasanirtiza/Pedestron 获取。

可泛化的行人检测:房间里的大象 | 最新论文 | HyperAI超神经