17일 전
FarSeg++: 고공해상도 원격 탐사 영상에서 지리공간 객체 분할을 위한 전경 인지 관계 네트워크
{Liangpei Zhang, Ailong Ma, Junjue Wang, Yanfei Zhong, Zhuo Zheng}
초록
지리공간 객체 세분화는 지구 시각화의 핵심 과제로, 고공간 해상도(HSR, high spatial resolution) 원격 탐사 영상에서 항상 척도 변동성, 배경의 높은 클래스 내 변동성, 그리고 전경과 배경 간의 불균형 문제에 직면한다. 일반적인 의미적 세분화 방법은 주로 자연 환경에서의 척도 변동성에 초점을 맞추지만, 대규모 지구 관측 환경에서는 나머지 두 가지 문제에 대한 고려가 부족한 실정이다. 본 논문에서는 관계 기반, 최적화 기반, 객체성 기반의 전경 모델링 관점에서 전경 인지 관계 네트워크(FarSeg++)를 제안하여 위의 두 가지 문제를 완화한다. 관계 기반 관점에서, 전경-장면 관계 모듈은 객체-장면 관계와 관련된 전경 연관 맥락을 활용하여 전경 특징의 구분력을 향상시킨다. 최적화 기반 관점에서, 전경 인지 최적화 기법을 제안하여 학습 중 전경 예시 및 어려운 배경 예시에 집중함으로써 균형 잡힌 최적화를 달성한다. 또한 객체성 기반 관점에서, 전경 인지 디코더를 도입하여 객체성 표현을 개선함으로써, 경험적 상한 경계 분석을 통해 드러난 주요 장벽인 객체성 예측 문제를 완화한다. 더불어, 제안된 방법의 효과성을 검증하고 객체성 예측 기술의 발전을 촉진하기 위해 새로운 대규모 고해상도 도시 차량 세분화 데이터셋을 제시한다. 실험 결과, FarSeg++는 최신의 일반적 의미적 세분화 방법들보다 우수하며, 속도와 정확도 사이의 균형을 더 효과적으로 달성함을 보여준다.