تحسين سريع لصور تحت الماء لتحسين الإدراك البصري

في هذا البحث، نقدم نموذجًا يعتمد على شبكة التوليد المتنافسة الشرطية (Conditional Generative Adversarial Network) لتحسين صور تحت الماء في الوقت الحقيقي. لضمان التدريب التنافسي، قمنا بصياغة دالة هدف تقيّم جودة الصورة الإدراكية بناءً على محتواها العالمي، ولونها، ونسيجتها المحلية، ومعلومات أسلوبها. كما نقدم مجموعة بيانات EUVP الضخمة التي تتكون من مجموعة مزدوجة وغير مزدوجة من صور تحت الماء (من جودة "ضعيفة" و"جيّدة") تم التقاطها باستخدام سبعة كاميرات مختلفة في ظروف رؤية متعددة خلال استكشافات المحيطات وتجارب التعاون بين الإنسان والروبوت. بالإضافة إلى ذلك، أجرينا العديد من التقييمات النوعية والكمية التي تقترح أن النموذج المقترح يمكنه تعلم كيفية تحسين جودة الصور تحت الماء من خلال التدريب المزدوج وغير المزدوج. وأهم من ذلك، فإن الصور المعززة توفر أداءً أفضل للنماذج القياسية للكشف عن الأشياء تحت الماء، وتقدير وضع الإنسان، والتوقع البصري. هذه النتائج تؤكد أن النموذج مناسب للمعالجة الأولية في الوقت الحقيقي ضمن خط الأنابيب الذاتي للروبوتات التي تُرشَد بالرؤية تحت الماء. يمكن الوصول إلى النموذج وخطوط الأنابيب المرتبطة به عبر الرابط: https://github.com/xahidbuffon/funie-gan.