WaterMask: 수중 영상에 대한 인스턴스 세그멘테이션

수중 이미지 인스턴스 세그멘테이션은 수중 이미지 분석 및 이해에 있어 기초적이고 핵심적인 단계이다. 그러나 일반적인 다중 클래스 인스턴스 세그멘테이션 데이터셋의 부족으로 인해 수중 이미지에 대한 인스턴스 세그멘테이션 연구가 제한되어 왔다. 본 논문에서는 7개 카테고리에 대해 픽셀 단위의 레이블을 제공하는 총 4,628장의 이미지를 포함하는 최초의 수중 이미지 인스턴스 세그멘테이션 데이터셋(UIIS)을 제안한다. 동시에, 수중 이미지 인스턴스 세그멘테이션을 위해 처음으로 WaterMask를 설계하였다. WaterMask에서는 먼저 이미지 품질 저하 및 다운샘플링으로 인해 손실된 세부 정보를 복원하기 위해 차이 유사도 그래프 주의 모듈(Difference Similarity Graph Attention Module, DSGAT)을 제안한다. 이를 통해 네트워크의 예측 성능을 향상시킨다. 이후, 다양한 스케일의 특징을 활용하여 전경 마스크와 경계 마스크를 별도로 예측하는 다수준 특징 개선 모듈(Multi-level Feature Refinement Module, MFRM)을 제안하고, 경계 학습 손실을 활용한 경계 마스크 전략(Boundary Mask Strategy, BMS)을 통해 네트워크를 안내하여 보다 정밀한 예측 결과를 도출한다. 광범위한 실험 결과는 ResNet-50과 ResNet-101 기반의 Mask R-CNN 대비 WaterMask가 각각 2.9, 3.8의 mAP 향상을 달성함을 보여준다. 코드 및 데이터셋은 https://github.com/LiamLian0727/WaterMask에서 제공된다.