15일 전
객체 카운팅을 위한 컨볼루션 네트워크의 공간 불변성에 대한 재고
Zhi-Qi Cheng, Qi Dai, Hong Li, JingKuan Song, Xiao Wu, Alexander G. Hauptmann

초록
이전 연구들은 일반적으로 합성곱 신경망의 공간 불변성(spacial invariance)을 향상시키는 것이 객체 수량화의 핵심이라고 보아왔다. 그러나 주요 수량화 네트워크들을 검증한 결과, 너무 엄격한 픽셀 수준의 공간 불변성은 밀도 맵 생성 과정에서 과적합 노이즈(overfit noise)를 유발할 수 있음을 놀랍게 발견하였다. 본 논문에서는 밀도 맵 내 공간 위치 추정을 위해 기존 합성곱 필터 대신 국소 연결형 가우시안 커널을 사용하는 방안을 제안한다. 이는 특징 추출 과정이 밀도 맵 생성 과정을 유도하여 레이블 노이즈를 효과적으로 극복할 수 있도록 유도하는 것을 목적으로 한다. 기존 연구를 영감으로 삼아, 대규모 가우시안 합성곱의 근사화를 효율적으로 구현하기 위해 낮은 랭크 근사(low-rank approximation)와 이동 불변성(translation invariance)을 결합한 방법을 제안한다. 본 연구는 향후 연구가 객체 수량화에서 지나치게 엄격한 픽셀 수준의 공간 불변성을 어떻게 적절히 완화할 것인지에 대한 새로운 방향을 제시한다. 제안한 방법은 MCNN, CSRNet, SANet, ResNet-50 등 4개의 주요 객체 수량화 네트워크에서 평가되었으며, 인구 밀도, 차량, 식물 수량화 등 3가지 응용 분야에 대해 7개의 대표적 벤치마크에서 광범위한 실험을 수행하였다. 실험 결과, 제안한 방법은 기존 최첨단 기법들을 뛰어넘는 성능을 보이며, 객체의 공간 위치에 대한 유망한 학습 능력을 입증하였다.