
摘要
本文研究了卷积神经网络(ConvNets)在行人检测任务中的应用。尽管卷积神经网络近年来取得了多方面的成功,但历史上其性能仍不及其他行人检测器。我们有意省略了在网络中显式建模问题(例如部件或遮挡建模),并展示了无需复杂技巧即可达到具有竞争力的性能。通过一系列广泛的实验,我们分析了小型和大型卷积神经网络的架构选择、参数以及不同训练数据的影响,包括在替代任务上的预训练。我们在Caltech和KITTI数据集上展示了最佳的卷积神经网络检测器。在Caltech数据集上,我们的卷积神经网络模型无论是在Caltech1x还是Caltech10x训练设置下均达到了顶级性能。通过在训练时使用额外的数据,我们最强的卷积神经网络模型即使在测试时也能够与使用额外数据(如光流)的检测器相媲美。