18일 전

CFC-Net: 원격 탐사 이미지에서 임의 방향 객체 탐지를 위한 핵심 특징 캡처 네트워크

Qi Ming, Lingjuan Miao, Zhiqiang Zhou, Yunpeng Dong
CFC-Net: 원격 탐사 이미지에서 임의 방향 객체 탐지를 위한 핵심 특징 캡처 네트워크
초록

광학 원격 탐사 영상에서의 객체 탐지는 중요한 동시에 도전적인 과제이다. 최근 몇 년간 컨볼루션 신경망 기반의 방법들이 큰 진전을 보였다. 그러나 객체의 크기, 종횡비, 그리고 임의의 방향성에 따른 큰 변동성으로 인해 탐지 성능을 더욱 향상시키는 것은 여전히 어려운 과제이다. 본 논문에서는 구분 능력 있는 특징(feature)이 객체 탐지에 미치는 역할을 탐구하고, 세 가지 측면에서 탐지 정확도를 향상시키기 위해 ‘핵심 특징 캡처 네트워크(Critical Feature Capturing Network, CFC-Net)’를 제안한다. 즉, 강력한 특징 표현 구축, 사전 설정된 앵커의 정교화, 그리고 레이블 할당 최적화이다. 구체적으로, 먼저 분류와 회귀 특징을 분리하고, 극성 주의 모듈(Polarization Attention Module, PAM)을 통해 각각의 작업에 적합한 강건한 핵심 특징을 구성한다. 추출된 구분 능력 있는 회귀 특징을 기반으로, 회전 앵커 정교화 모듈(Rotation Anchor Refinement Module, R-ARM)은 사전 설정된 수평 앵커에 대해 위치 정교화를 수행하여 우수한 회전 앵커를 생성한다. 이후, 핵심 특징을 효과적으로 포착할 수 있는 능력에 따라 고품질 앵커를 자동으로 선택하는 동적 앵커 학습(Dynamic Anchor Learning, DAL) 전략을 제안한다. 제안된 프레임워크는 원격 탐사 영상 내 객체에 대해 더 강력한 의미 표현을 생성하며, 높은 성능의 실시간 객체 탐지를 달성한다. HRSC2016, DOTA, UCAS-AOD 등 세 가지 원격 탐사 데이터셋에서의 실험 결과는 본 방법이 다수의 최첨단 기법들과 비교해 우수한 탐지 성능을 보임을 보여준다. 코드와 모델은 https://github.com/ming71/CFC-Net 에서 공개되어 있다.

CFC-Net: 원격 탐사 이미지에서 임의 방향 객체 탐지를 위한 핵심 특징 캡처 네트워크 | 최신 연구 논문 | HyperAI초신경