2달 전
LOGCAN++: 원격 감지 영상의 의미 분할을 위한 적응형 로컬-글로벌 클래스 인식 네트워크
Xiaowen Ma; Rongrong Lian; Zhenkai Wu; Hongbo Guo; Mengting Ma; Sensen Wu; Zhenhong Du; Siyang Song; Wei Zhang

초록
원격 감지 이미지는 복잡한 배경, 크기와 방향의 변동, 그리고 큰 클래스 내 변동을 특징으로 합니다. 일반적인 의미 분할 방법은 이러한 문제를 완전히 조사하지 못하므로 원격 감지 이미지 분할에서 성능이 제한적입니다. 본 논문에서는 원격 감지 이미지를 위한 맞춤형 의미 분할 모델인 LOGCAN++를 제안합니다. 이 모델은 글로벌 클래스 인식(GCA) 모듈과 여러 로컬 클래스 인식(LCA) 모듈로 구성됩니다. GCA 모듈은 클래스 수준의 맥락 모델링을 위해 글로벌 표현을 포착하여 배경 노이즈의 간섭을 줄입니다. LCA 모듈은 중간 지각 요소로서 로컬 클래스 표현을 생성하여 픽셀을 글로벌 클래스 표현과 간접적으로 연관시키는 것을 목표로 하며, 큰 클래스 내 변동 문제를 해결하기 위함입니다. 특히, LCA 모듈에서 아핀 변환(affine transformation)을 도입하여 원격 감지 이미지에서 크기와 방향의 변동에 효과적으로 대응할 수 있도록 적응적인 로컬 클래스 표현 추출을 수행합니다. 세 가지 벤치마크 데이터셋에 대한 광범위한 실험 결과, 제안된 LOGCAN++가 현재 주류 일반 및 원격 감지 의미 분할 방법보다 우수하며 속도와 정확성 사이에서 더 나은 균형을 이루는 것으로 나타났습니다. 코드는 https://github.com/xwmaxwma/rssegmentation에서 제공됩니다.