2달 전
실시간 주요 객체 검출을 위한 간단한 풀링 기반 설계
Jiang-Jiang Liu; Qibin Hou; Ming-Ming Cheng; Jiashi Feng; Jianmin Jiang

초록
우리는 컨볼루션 신경망에서 풀링의 역할을 확장하는 방법을 조사하여 주요 객체 검출 문제를 해결합니다. U자형 구조를 기반으로 하여, 먼저 바닥에서 위로의 경로에 전역 가이드 모듈(Global Guidance Module, GGM)을 구축하여 다양한 특징 수준의 층에 잠재적인 주요 객체의 위치 정보를 제공하는 것을 목표로 합니다. 또한, 상위에서 하위로의 경로에서의 특징 집계 모듈(Feature Aggregation Module, FAM)을 설계하여 거친 수준의 의미 정보가 세부 수준의 특징과 잘 융합될 수 있도록 합니다. 상위에서 하위로의 경로에서 융합 연산 후 FAMs를 추가함으로써 GGM에서 얻은 거친 수준의 특징이 다양한 크기의 특징과 원활하게 통합됩니다. 이 두 개의 풀링 기반 모듈은 고수준 의미 특징이 점진적으로 정교해져서 세부 정보가 풍부한 주목도 맵(saliency map)을 생성할 수 있게 합니다. 실험 결과는 제안된 접근법이 더 정확하게 주요 객체를 위치시키고 세밀한 디테일을 갖게 함으로써 이전 최신 기술들보다 실질적으로 성능을 크게 향상시킬 수 있음을 보여줍니다. 또한 우리의 접근법은 빠르며, $300 \times 400$ 크기의 이미지를 처리할 때 30 FPS 이상으로 실행할 수 있습니다. 코드는 http://mmcheng.net/poolnet/ 에서 확인할 수 있습니다.