LoveDA: 도메인 적응형 세분화를 위한 원격 탐사 토지 피복 데이터셋

딥러닝 기법은 원격 감지 고해상도(HSR) 토지피복 지도 작성 분야에서 유망한 성과를 보여주고 있다. 그러나 도시와 농촌 환경은 완전히 다른 지리적 특성을 지니며, 기존 알고리즘의 일반화 능력 부족으로 인해 도시 수준 또는 국가 수준의 지도 작성에 어려움이 있다. 기존의 대부분 HSR 토지피복 데이터셋은 주로 의미 표현 학습 연구를 촉진하는 데 초점을 맞추고 있어, 모델의 전이 가능성(transferability)에 대한 고려가 부족하다. 본 논문에서는 의미론적 및 전이 가능한 학습을 촉진하기 위해 Land-cOVEr Domain Adaptive semantic segmentation (LoveDA) 데이터셋을 제안한다. LoveDA 데이터셋은 세 도시에서 수집된 총 5,987장의 고해상도 이미지와 166,768개의 레이블링 객체를 포함하고 있다. 기존 데이터셋과 비교해 LoveDA는 도시 및 농촌이라는 두 가지 서로 다른 도메인을 포함하고 있어, 다음과 같은 도전 과제를 제기한다: 1) 다중 규모 객체의 존재; 2) 복잡한 배경 샘플; 3) 클래스 분포의 불일치. 이 데이터셋은 토지피복 의미론적 분할과 비지도 도메인 적응(UDA) 작업 모두에 적합하다. 이를 바탕으로, 우리는 11가지 의미론적 분할 방법과 8가지 UDA 방법을 기준으로 LoveDA 데이터셋을 평가하였다. 또한 다중 규모 아키텍처 및 전략, 추가적인 배경 감독, 가상 레이블 분석 등 탐색적 연구를 수행하여 이러한 도전 과제를 해결하고자 하였다. 코드 및 데이터는 https://github.com/Junjue-Wang/LoveDA 에서 공개되어 있다.