17일 전

FactSeg: 대규모 원격 감지 영상에서 전경 활성화 기반의 소형 객체 세분화

{Zhuo Zheng, Yanfei Zhong, Junjue Wang, Ailong Ma}
초록

소형 객체 세분화(Small Object Semantic Segmentation) 작업은 고해상도 원격 감시(HRS) 영상에서 핵심 객체를 자동으로 추출하는 것을 목표로 한다. 원격 감시 영상의 대규모 커버리지 영역에 비해, HRS 영상 내의 핵심 객체(예: 자동차, 선박 등)는 종종 몇 개의 픽셀에 불과하다. 본 논문에서는 이러한 문제를 해결하기 위해 구조적 설계 및 최적화 측면에서 전경 활성화(Foreground Activation, FA) 기반의 소형 객체 세분화(FactSeg) 프레임워크를 제안한다. 구조 설계 측면에서, 소형 객체 내 약한 특징에 대한 인식을 강화하기 위해 FA 객체 표현(Foreground Activation Object Representation)을 제안한다. 이 FA 객체 표현 프레임워크는 이중 분기 디코더(dual-branch decoder)와 협업 확률(Collaborative Probability, CP) 손실 함수로 구성된다. 이중 분기 디코더에서는 FA 분기(FA branch)가 소형 객체 특징을 활성화(activation)하고, 대규모 배경을 억제하도록 설계되었으며, 세분화 보강(Semantic Refinement, SR) 분기(SR branch)는 소형 객체를 더욱 정교하게 구분하도록 설계되었다. CP 손실 함수는 CP 가정 하에서 디코더의 활성화 출력과 보강 출력을 효과적으로 통합하기 위해 제안되었다. 협업 과정에서, 활성화 출력을 통해 소형 객체의 약한 특징이 강화되며, 보강 출력은 이진 출력의 정교화된 형태로 해석될 수 있다. 최적화 단계에서는 소형 객체 채굴(Small Object Mining, SOM) 기반의 네트워크 최적화 기법을 도입하여, 효과적인 샘플을 자동으로 선별함으로써 최적화 방향을 정밀하게 조정하고, 소형 객체와 대규모 배경 간의 샘플 불균형 문제를 해결한다. 두 가지 기준 HRS 영상 세분화 데이터셋을 활용한 실험 결과, 제안된 프레임워크가 최신 기술(SOTA) 세분화 방법들을 초월하며, 정확도와 효율성 사이에 우수한 균형을 달성함을 입증하였다.