전이란 과정이다: 매우 고해상도 원격 감지 이미지에 대한 페어 단위 비디오 변경 탐지 네트워크
지구 관측 분야에서 중요한 과제이면서도 도전적인 과제인 변화 탐지(change detection, CD)는 딥러닝의 광범위한 적용과 함께 기술적 혁신을 겪고 있다. 그러나 기존의 딥러닝 기반 CD 기법들은 여전히 두 가지 주요한 문제에 직면해 있다. 첫째, 시간적 모델링의 부족이며, 둘째, 공간-시간 상호의존성(spatio-temporal coupling)이다. 이러한 문제들을 고려하여, 우리는 시간에 대한 보다 명시적이고 정교한 모델링을 제안하고, 이를 바탕으로 쌍-비디오 변화 탐지(pair-to-video change detection, P2V-CD) 프레임워크를 구축하였다. 먼저, 입력된 이미지 쌍에서 풍부한 시간 정보를 담고 있는 가상의 전이 비디오(pseudo transition video)를 생성함으로써, CD 문제를 비디오 이해(video understanding) 문제로 재정의한다. 이후, 공간적 및 시간적 전이 유형을 각각 독립적으로 인식할 수 있도록 두 개의 분리된 인코더를 활용하며, 이들 인코더는 횡방향 연결(lateral connection)을 통해 상호 보완적으로 작동하도록 설계된다. 더불어, 모델 학습을 가속화하기 위해 심층 감독(deep supervision) 기법을 도입하였다. 실험을 통해 P2V-CD 방법이 시각적 효과와 평가 지표 측면에서 기존 최첨단 CD 기법들과 비교해 우수한 성능을 보임을 입증하였으며, 모델 크기는 적당하고 계산량도 상대적으로 낮은 수준을 유지하고 있다. 광범위한 특징 맵 시각화 실험을 통해 본 연구 방법이 이시기 이미지 간의 대비를 넘어서 어떻게 변화를 이해하고 탐지하는지에 대한 메커니즘을 명확히 보여준다. 소스 코드는 다음 링크에서 제공된다: https://github.com/Bobholamovic/CDLab.