FishSegSSL: إطار عمل للتقسيم الدلالي شبه المُراقب للصور البيضاوية
يُعد تطبيق كاميرات ذات مجال رؤية واسع (FoV) مزودة بعدسات "السمكة" (fish-eye) ميزة بارزة في تطبيقات الرؤية الحاسوبية الواقعية المتنوعة، بما في ذلك القيادة الذاتية. وعلى الرغم من النجاح الكبير الذي حققته التعلم العميق في تطبيقات الرؤية الحاسوبية التقليدية التي تعتمد على الصور المنظورية العادية، إلا أن إمكاناته في سياقات كاميرات "السمكة" لا تزال غير مستكشفة بشكل واسع، نظرًا لقلة المجموعات البيانات المتاحة لتعلم مراقبة كاملة. ويُعد التعلم شبه المراقب (Semi-supervised learning) حلًا محتملًا لتغلب على هذا التحدي. في هذه الدراسة، نستعرض ونُقيّم طريقتين شائعتين للتعلم شبه المراقب من مجال الصور المنظورية العادية، في سياق تقسيم صور "السمكة". كما نقدّم "فِيش سِيغ إس إس إل" (FishSegSSL)، وهي إطار جديد لتقسيم صور "السمكة"، يعتمد على ثلاث مكونات شبه مراقبة: تنقية التسميات الوهمية (pseudo-label filtering)، و.threshold التكيّفي للثقة الديناميكية (dynamic confidence thresholding)، وتعزيز قوي مرن (robust strong augmentation). وقد أظهرت النتائج المُقدمة على مجموعة بيانات "وودسكيب" (WoodScape)، التي تم جمعها باستخدام كاميرات "السمكة" المثبتة على المركبات، أن الطريقة المقترحة تُحسّن أداء النموذج بنسبة تصل إلى 10.49% مقارنة بالطرق المراقبة الكاملة، مع استخدام نفس كمية البيانات المُعلَّمة. كما أن طريقتنا تُحسّن الطرق الحالية لتقسيم الصور بنسبة 2.34%. إلى حد علمنا، فإن هذه الدراسة تمثل أول عمل يتناول التصنيف الدلالي شبه المراقب لصور "السمكة". علاوةً على ذلك، قمنا بدراسة تحليلية شاملة للتأثيرات (ablation study) وتحليل حساسية (sensitivity analysis) لتوضيح فعالية كل عنصر مُقترح في هذه الدراسة.