
초록
우리는 일반적으로 사용되는 부스팅 결정 트리 분류기의 모델링 한계를 연구하고자 합니다. 대규모 데이터에 의존하는 시각 인식 모델(예: 딥 컨볼루션 신경망)의 성공에서 영감을 얻어, 이 논문은 약한 학습자의 모델링 용량, 데이터셋 크기 및 데이터셋 특성 간의 관계에 초점을 맞추고 있습니다. Caltech 보행자 검출 벤치마크에서 수행된 일련의 새로운 실험은 CNN 기술을 제외한 가장 우수한 성능을 달성하였으며, 빠른 실행 시간 속도를 유지하였습니다. 또한 HOG+LUV 채널만을 특징으로 사용하여 딥 아키텍처와 동등한 성능(로그 평균 누락률 9.71%)을 보여주었습니다. 이 연구의 결론은 FDDB 얼굴 검출 벤치마크(정확도 93.37%)에서 다른 객체 검출 영역에도 일반화될 수 있음을 입증하였습니다. 그러나 인상적인 성능에도 불구하고, 이 연구는 일반적인 부스팅 트리 모델의 제한된 모델링 용량을 드러내며, 다중 수준 및 매우 깊은 아키텍처와 경쟁하기 위해 아키텍처 변경이 필요함을 강조합니다.