
要約
水中画像のインスタンスセグメンテーションは、水中画像の分析と理解において基盤的かつ重要なステップである。しかし、一般化された多クラスインスタンスセグメンテーション用データセットの不足が、水中画像に対するインスタンスセグメンテーション研究の発展を阻んできた。本論文では、7つのカテゴリを対象に4,628枚の画像を含み、ピクセル単位のアノテーションを提供する、初めての水中画像インスタンスセグメンテーションデータセット「UIIS(Underwater Image Instance Segmentation)」を提案する。同時に、水中画像インスタンスセグメンテーション用に初めて設計された「WaterMask」も提案する。WaterMaskでは、まず画像品質の劣化およびダウンサンプリングによる詳細情報の喪失を補うため、差分類似性グラフアテンションモジュール(DSGAT)を導入する。続いて、異なるスケールの特徴量を用いて前景マスクと境界マスクを別々に予測するためのマルチレベル特徴精緻化モジュール(MFRM)を提案し、境界学習損失を用いた境界マスク戦略(BMS)によりネットワークの学習をガイドすることで、より精密な予測結果を実現する。広範な実験結果から、ResNet-50およびResNet-101を用いた場合、WaterMaskはMask R-CNNに対してそれぞれ2.9、3.8のmAP向上を達成することが明らかになった。コードおよびデータセットは、https://github.com/LiamLian0727/WaterMask にて公開されている。