방향성과 밀집 배치된 객체 탐지를 위한 동적 개선 네트워크

지난 10년간 객체 탐지 기술은 놀라운 발전을 이뤘다. 그러나 객체들이 기울어진 방향을 가지거나 밀집해 있는 경우 탐지가 여전히 도전적인 과제로 남아 있다. 이는 다음과 같은 내재적인 이유들 때문이다: (1) 뉴런의 수용 영역(receptive fields)은 모두 축에 맞춰져 있고 동일한 형태를 가지지만, 실제 객체들은 다양한 형태를 갖고 있으며 다양한 방향으로 배열되어 있다; (2) 탐지 모델은 일반적인 지식을 기반으로 학습되기 때문에, 테스트 시 특정 객체에 대한 일반화 능력이 부족할 수 있다; (3) 관련 데이터셋의 제한적인 양이 이 과제의 발전을 저해한다. 위 두 가지 문제를 해결하기 위해, 우리는 두 가지 새로운 구성 요소—특징 선택 모듈(Feature Selection Module, FSM)과 동적 정밀화 헤드(Dynamic Refinement Head, DRH)—를 포함하는 동적 정밀화 네트워크(Dynamic Refinement Network, DRN)를 제안한다. 본 FSM은 타깃 객체의 형태와 방향에 따라 뉴런의 수용 영역을 조정할 수 있도록 하며, DRH는 객체 인지 인식을 기반으로 예측을 동적으로 정밀화할 수 있는 능력을 모델에 부여한다. 관련 벤치마크의 부족 문제를 해결하기 위해, SKU110K 데이터셋을 기반으로 기울어진 경계 상자(oriented bounding boxes)로 재라벨링한 광범위하고 완전히 주석 처리된 데이터셋인 SKU110K-R을 수집하였다. 우리는 DOTA, HRSC2016, SKU110K 및 자체 개발한 SKU110K-R 데이터셋을 포함한 여러 공개 벤치마크에서 정량적 평가를 수행하였다. 실험 결과, 기존의 기준 모델 대비 본 방법이 일관되면서도 두드러진 성능 향상을 보였다. 코드와 데이터셋은 https://github.com/Anymake/DRN_CVPR2020 에서 공개된다.