3달 전

항공 이미지에서 강건한 객체 탐지를 위한 모델 상호작용을 통한 앵커 리트러치

Dong Liang, Qixiang Geng, Zongqi Wei, Dmitry A. Vorontsov, Ekaterina L. Kim, Mingqiang Wei, Huiyu Zhou
항공 이미지에서 강건한 객체 탐지를 위한 모델 상호작용을 통한 앵커 리트러치
초록

객체 검출은 컴퓨터 비전 분야에서 막대한 발전을 이루었다. 특히 항공 관측에서 나타나는 외형 품질 저하를 동반한 소형 객체 검출은 중요한 도전 과제로 남아 있다. 히우리스틱 학습을 위해 충분한 긍정/부정 샘플을 확보하기 위해 대부분의 객체 검출기들은 지정된 영역 앵커(anchors)를 사전 설정하여 정답 데이터와의 교차율(Intersection-over-Union, IoU)을 계산한다. 그러나 이러한 방식에서는 소형 객체가 자주 무시되거나 잘못 레이블링되는 문제가 발생한다. 본 논문에서는 새로운 학습 샘플 생성기를 구축하기 위해 효과적인 동적 강화 앵커(Dynamic Enhancement Anchor, DEA) 네트워크를 제안한다. 기존 최첨단 기술들과 달리, 제안된 네트워크는 앵커 기반 유닛과 앵커리스 유닛 간의 상호작용을 통해 샘플을 선별하는 샘플 판별기(sample discriminator)를 활용하여 적합한 샘플을 생성한다. 또한, 보수적인 앵커 기반 추론 방식과 다중 작업 공동 학습(multi-task joint training)을 통해 제안된 모델의 성능을 향상시키면서도 계산 복잡도를 감소시킨다. 제안된 기법은 방향성 객체 검출과 수평 객체 검출 모두를 지원한다. DOTA와 HRSC2016이라는 두 가지 도전적인 항공 기반 데이터셋에서 실시한 광범위한 실험 결과, 본 방법은 정확도 면에서 최첨단 성능을 달성하면서도 중간 수준의 추론 속도와 학습 시 계산 부담을 유지함을 확인하였다. DOTA에서 RoI-Transformer 기반 베이스라인과 통합된 DEA-Net은, 더 약한 백본 네트워크(ResNet-101 대신 ResNet-152)를 사용함에도 불구하고 방향성 객체 검출에서 기존 최고 성능 대비 0.40% 높은 평균 정밀도(mAP)를 기록하였으며, 동일한 백본을 사용한 수평 객체 검출에서는 3.08% 높은 mAP를 달성하였다. 또한 ReDet 기반 베이스라인과 통합된 DEA-Net은 80.37%의 최고 성능을 기록하며 기존 최고 수준을 초과하였다. HRSC2016에서는 단지 3개의 수평 앵커만을 사용하여 기존 최고 모델보다 1.1% 높은 성능을 달성하였다.