17일 전
SpotNet: 객체 탐지를 위한 자기주의 다중 작업 네트워크
Hughes Perreault, Guillaume-Alexandre Bilodeau, Nicolas Saunier, Maguelonne Héritier

초록
인간은 특정 종류의 객체를 탐색할 때 관련 영역에 시각적 주의를 효과적으로 집중하는 데 매우 뛰어나다. 예를 들어 자동차를 찾을 때 우리는 건물의 꼭대기보다 도로를 주시하게 된다. 본 논문의 동기는 다중 작업 학습(multi-task learning) 접근법을 통해 네트워크가 동일한 방식으로 시각적 주의를 조절하도록 훈련하는 것이다. 시각적 주의를 훈련하기 위해, 배경 제거(background subtraction) 또는 광학 흐름(optical flow)을 활용하여 반자율(semi-supervised) 방식으로 전경/후경 분할 레이블을 생성한다. 이러한 레이블을 이용해 객체 탐지 모델을 훈련함으로써, 전경/후경 분할 맵과 함께 경계 상자(bounding boxes)를 생성하도록 하되, 대부분의 모델 파라미터를 공유한다. 이 분할 맵을 네트워크 내부에서 자체 주의(self-attention) 메커니즘으로 활용하여, 경계 상자를 생성하는 데 사용되는 특징 맵의 가중치를 조절함으로써 관련이 없는 영역의 신호를 감소시킨다. 실험 결과, 본 방법을 적용함으로써 두 개의 교통 감시 데이터셋에서 mAP(mean Average Precision)가 크게 향상되었으며, 특히 UA-DETRAC 및 UAVDT 데이터셋에서 최신 기술 수준(state-of-the-art)의 성능을 달성하였다.