要約
海洋動物に関する研究は人類にとって極めて重要であり、多くの研究分野において基盤的な役割を果たしている。画像処理を用いてこうした動物を識別する手法は、海洋動物セグメンテーション(Marine Animal Segmentation, MAS)という課題を生み出すが、その実現は依然として困難な課題である。深層ニューラルネットワークは物体セグメンテーションに広く応用されているものの、水中環境における複雑な画像劣化状態や海洋動物の擬態特性を十分に考慮した手法は依然として少ない。本研究では、こうした課題に対応するため、堅牢な深層海洋動物セグメンテーションネットワークを提案する。具体的には、元の物体の劣化特性および擬態特性をランダムに変化させる新たなデータ拡張戦略を設計した。この拡張を活用して、シアンジア(Siamese)構造に基づく融合型深層ニューラルネットワークを学習させ、共通の意味的表現を獲得するように設計した。さらに、広範な実験を実施するため、新たな大規模な実世界MASデータセットを構築した。このデータセットは、3000枚以上の水中シーンと多様な物体を含み、各画像はオブジェクトレベルのマスクでアノテーションされ、カテゴリに分類されている。広範な実験結果から、本手法が12の最先端手法を顕著に上回ることが明らかになった。これは、定性的および定量的に両方において優れた性能を示している。