WaterMask: التجزئة الفردية للصور تحت الماء

التصنيف التفصيلي للصور تحت الماء هو خطوة أساسية وحاسمة في تحليل وفهم الصور تحت الماء. ومع ذلك، فإن نقص البيانات العامة المُصنفة تفصيليًا متعددة الفئات قد عرقل تطور الدراسات المتعلقة بالتصنيف التفصيلي للصور تحت الماء. في هذه الورقة، نقترح أول مجموعة بيانات للتصنيف التفصيلي للصور تحت الماء (UIIS)، التي توفر 4628 صورة مصنفة إلى 7 فئات، مع تسميات على مستوى البكسل. وفي الوقت نفسه، نُقدّم لأول مرة نموذج WaterMask للتصنيف التفصيلي للصور تحت الماء. في نموذج WaterMask، نُصمم أولاً وحدة الانتباه الرسومية المتميزة بالتشابه (DSGAT) لإعادة استرجاع المعلومات التفصيلية الضائعة نتيجة لتدهور جودة الصورة والتقليل من الحجم، بهدف مساعدة الشبكة في التنبؤ. ثم نقترح وحدة تحسين الميزات متعددة المستويات (MFRM) للتنبؤ بخرائط الكائنات الأمامية وخرائط الحدود بشكل منفصل باستخدام ميزات على مقاييس مختلفة، ونوجه الشبكة من خلال استراتيجية خريطة الحدود (BMS) مع دالة خسارة تعليم الحدود، مما يُعزز من دقة النتائج. أظهرت النتائج التجريبية الواسعة أن WaterMask يحقق مكاسب كبيرة تصل إلى 2.9 و3.8 نقطة في متوسط الدقة المحسوبة (mAP) مقارنةً بـ Mask R-CNN عند استخدام ResNet-50 وResNet-101 على التوالي. يمكن الوصول إلى الكود والبيانات من خلال الرابط: https://github.com/LiamLian0727/WaterMask.