4달 전

보행자 검출을 위한 다층 채널 특성 학습

Jiale Cao; Yanwei Pang; Xuelong Li
보행자 검출을 위한 다층 채널 특성 학습
초록

보행자 검출은 합성곱 신경망(CNN)과 전통적인 수작업 특징(HOG+LUV)의 조합을 기반으로 큰 성공을 거두었습니다. 일반적으로 HOG+LUV는 후보 제안을 생성하는 데 사용되고, 그 다음에 CNN이 이러한 제안들을 분류합니다. 그러나 이 방법에도 불구하고 개선의 여지가 있습니다. 예를 들어, CNN은 완전 연결 계층(full-connected layer)의 특징을 통해 이러한 제안들을 분류하지만, 제안 점수와 CNN 내부 계층(inner-layers)의 특징은 무시됩니다. 본 논문에서는 이러한 단점을 극복하기 위해 다중 계층 채널 특징(Multilayer Channel Features, MCF)이라는 통합 프레임워크를 제안합니다. 먼저 MCF는 HOG+LUV를 CNN의 각 계층과 통합하여 다중 계층 이미지 채널을 생성합니다. 이후 다중 계층 이미지 채널을 기반으로 다단계 카스케이드 AdaBoost를 학습합니다. 다단계 카스케이드의 각 단계에서 약분류기는 해당 계층의 이미지 채널로부터 학습됩니다. 더 풍부한 특징 덕분에 MCF는 Caltech 보행자 데이터셋에서 최고 수준의 성능(즉, 10.40% 누락률)을 달성했습니다. 새로운 정확한 주석을 사용하면 MCF는 7.98% 누락률을 달성할 수 있습니다. 초기 몇 단계에서 많은 비보행자 검출 창들이 빠르게 거부되기 때문에, 검출 속도가 1.43배 가속화됩니다. 첫 단계 이후에 점수가 낮은 높게 겹치는 검출 창들을 제거함으로써 성능 저하를 거의 없애면서 4.07배 더 빠른 처리가 가능해졌습니다.