MARIDA: 센티넬-2 원격 탐사 데이터를 활용한 해양 쓰레기 탐지 기준 평가 지표

현재 많은 연구가 원격 탐사 기반으로 해양 쓰레기의 탐지 및 스펙트럼 특성 평가에 집중되어 있으며, 궁극적으로 새로운 운영용 모니터링 솔루션을 개발하는 것을 목표로 하고 있다. 본 연구에서는 해양 쓰레기 탐지를 가능하게 하는 기계학습(ML) 알고리즘의 개발 및 평가를 위한 벤치마크 데이터셋으로서 '해양 쓰레기 아카이브(MARIDA)'를 소개한다. MARIDA는 다중 스펙트럼 센티넬-2(Sentinel-2, S2) 위성 데이터를 기반으로 한 세계 최초의 데이터셋으로, 해양 쓰레기를 다양한 공존하는 해양 특성(예: 사가스룸 대형조류, 선박, 자연 유기물, 파도, 선미 자국, 거품, 서로 다른 수질 유형(명암수, 탁한수, 퇴적물 함유수, 얕은 수역), 구름 등)과 구분할 수 있도록 설계되었다. 본 데이터셋은 전 세계 여러 지리적 지역에서 다양한 계절, 연도 및 해상 상태 조건에서 검증된 플라스틱 쓰레기 사건에 대한 지리정보 참조 다각형/픽셀(annotation)을 제공한다. 또한 MARIDA 데이터셋에 대한 철저한 스펙트럼 및 통계 분석과 함께, 약한 지도(semi-supervised) 세그멘테이션 및 다중 레이블 분류 작업에 대한 잘 정립된 기계학습 기준 모델을 제시한다. MARIDA는 오픈 액세스 데이터셋으로, 연구 공동체가 특정 부유 물질, 해상 상태 특성 및 수질 유형의 스펙트럼 행동을 탐색하고, 인공지능 및 딥러닝 아키텍처를 기반으로 한 해양 쓰레기 탐지 솔루션과 위성 전처리 파이프라인을 개발하고 평가할 수 있도록 지원한다.