2달 전
변형 가능한 부분 모델은 합성곱 신경망입니다.
Ross Girshick; Forrest Iandola; Trevor Darrell; Jitendra Malik

초록
변형 가능한 부품 모델(DPMs)과 합성곱 신경망(CNNs)은 시각 인식을 위한 두 가지 널리 사용되는 도구입니다. 일반적으로 이들은 서로 다른 접근 방식으로 여겨집니다: DPMs는 그래픽 모델(마르코프 랜덤 필드)인 반면, CNNs는 "블랙박스" 비선형 분류기입니다. 본 논문에서는 DPM이 CNN으로 표현될 수 있음을 보여주어, 두 아이디어의 새로운 통합을 제공합니다. 우리의 구조화 과정은 DPM 추론 알고리즘을 펼치고 각 단계를 동일한(그리고 때로는 새로운) CNN 계층에 매핑하는 것을 포함합니다. 이러한 관점에서, DPM에서 표준 이미지 특징을 학습된 특징 추출기로 대체하는 것이 자연스럽게 됩니다. 이를 통해 얻어진 모델을 DeepPyramid DPM이라고 명명하고, PASCAL VOC 데이터셋에서 실험적으로 검증하였습니다. DeepPyramid DPM은 방향 그래디언트 히스토그램(HOG) 특징을 기반으로 하는 DPM보다 크게 우수하며, 최근 소개된 R-CNN 탐지 시스템의 유사한 버전보다 약간 우수한 성능을 보여주면서도 실행 속도가 10배 이상 빠릅니다.