심층 학습 모델의 토지 피복 이미지 분류를 위한 벤치마킹 및 스케일링

코페르니쿠스 센티넬-2 이미지의 막대한 양이 활용 가능해지면서, 지상 이용/지표 상태(LULC) 이미지 분류를 위한 딥러닝(DL) 기법의 활용 가능성이 새롭게 열렸다. 그러나 현재까지는 동일한 데이터셋에서 동일한 하드웨어 환경에서, 일관된 평가 지표를 사용해 다양한 DL 모델을 비교할 수 있는 체계적인 벤치마킹 실험 세트가 부족한 실정이다. 본 연구에서는 BigEarthNet 센티넬-2 데이터셋을 활용하여, 다중 레이블·다중 클래스 LULC 이미지 분류 문제에 대해 최신의 다양한 딥러닝 모델을 처음으로 벤치마킹하였으며, 총 60개의 훈련된 모델로 구성된 포괄적인 모델 생태계를 제시한다. 이 벤치마킹은 전통적인 CNN뿐만 아니라 비컨볼루션 기반 방법도 포함한다. 특히, 효율적인 네트워크(EfficientNets)와 넓은 잔차망(Wide Residual Networks, WRN) 아키텍처를 평가하고, 분류 정확도, 훈련 시간, 추론 속도를 종합적으로 분석한다. 또한, 경량화된 WRN 모델에 대해 EfficientNet 프레임워크를 활용한 복합 스케일링(Compound Scaling) 전략을 제안한다. 이 모델은 효율적인 채널 주의 메커니즘(Efficient Channel Attention)을 통합하여, 표준 ResNet50 기준 모델 대비 19개 LULC 클래스의 평균 F-스코어 분류 정확도에서 4.5% 향상된 성능을 달성하였으며, 훈련 가능한 파라미터 수는 약 10배 감소하였다. 본 연구는 모든 훈련된 모델과 다중 GPU 노드에서의 분산 훈련을 위한 코드를 공개한다. 이 전처리된 인코더 모델 생태계는 센티넬-2 데이터를 활용하는 다양한 원격 탐사 작업에서 전이 학습(transfer learning) 및 빠른 프로토타이핑에 활용할 수 있으며, 이미지넷(ImageNet) 등 다른 도메인 데이터로 훈련된 백본 모델을 사용하는 것보다 더 적합한 선택이 될 수 있다. 다양한 규모의 데이터셋에서 전이 학습의 적합성을 검증하였으며, 최고 성능을 기록한 WRN 모델은 SEN12MS 데이터셋에서 71.1%의 F-스코어를 달성하여 현재까지의 최고 성능을 기록했으며, 훈련 데이터셋의 소수에만 노출된 상태에서도 우수한 성능을 보였다.