
摘要
我们旨在研究常用的提升决策树分类器的建模局限性。受大型、数据驱动的视觉识别模型(如深度卷积神经网络)成功案例的启发,本文重点探讨了弱学习器的建模能力、数据集规模和数据集属性之间的关系。通过在Caltech行人检测基准上进行一系列新颖的实验,该方法在非CNN技术中实现了已知的最佳性能,同时保持了快速的运行时速度。此外,仅使用HOG+LUV通道作为特征,其性能与深度架构相当(对数平均漏检率为9.71%)。尽管表现令人印象深刻,但本研究揭示了常用提升树模型有限的建模能力,从而激发了对其进行结构改进的需求,以与多层和非常深的架构竞争。这一结论在不同的目标检测领域也得到了验证,例如在FDDB人脸检测基准上的测试结果表明其准确率达到93.37%。