전 세계 원격 감측 데이터를 이용한 작물 분류를 위한 최적의 다중 시점 학습 모델 탐색

작물 재배지 연구와 분석은 그 성장 행동의 동적이고 이질적인 특성 때문에 어려운 작업입니다. 일반적으로, 이를 추정하기 위해 다양한 데이터 소스를 수집할 수 있습니다. 딥러닝 모델은 작물 분류 작업에서 뛰어난 성능을 보여주었지만, 다중 입력을 처리하는 데 있어 상당한 도전에 직면해 있습니다. 이러한 다중 입력을 처리하는 방법론인 다시야학습(Multi-View Learning, MVL)은 인코더 아키텍처, 융합 전략, 최적화 기법에 따라 구조화될 수 있습니다. 문헌에서는 주로 지역별 특정 인코더 아키텍처를 사용하는 것에 초점을 맞추고 있으며, MVL 방법론의 다른 구성 요소들에 대한 깊은 탐구가 부족한 상태입니다. 반면에, 우리는 융합 전략과 인코더 아키텍처의 동시 선택을 조사하여 전 세계 규모의 작물 재배지 및 작물 유형 분류를 평가합니다. 가능한 MVL 방법의 구성으로서 5개의 융합 전략(입력(Input), 특징(Feature), 결정(Decision), 앙상블(Ensemble), 하이브리드(Hybrid))와 5개의 시계열 인코더(LSTM, GRU, TempCNN, TAE, L-TAE)를 사용합니다. 검증을 위해 CropHarvest 데이터셋을 사용하였으며, 이는 광학적 정보, 레이다 정보, 기상 시간 시리즈 및 지형 정보를 입력 데이터로 제공합니다. 우리는 라벨링된 샘플 수가 제한적인 시나리오에서 단일 구성이 모든 경우에 충분하지 않다는 것을 발견하였습니다. 대신, 특정 인코더와 융합 전략의 조합을 철저히 찾아야 합니다. 이 탐색 과정을 간소화하기 위해, 우리는 특정 융합 전략에 맞춤화된 최적의 인코더 아키텍처를 식별하고, 그 다음으로 가장 적합한 융합 전략을 결정하는 방법을 제안합니다. 우리는 MVL 방법론을 통해 작물 분류를 연구하는 연구자들을 위한 체계적인 접근 방식을 제공합니다.