CE-VAE: مُحسِّن الصور تحت الماء باستخدام الكبسولات المعززة للشبكة التلقائية المتغيرة

تحليل الصور تحت الماء بدون طيار لرصد البيئة البحرية يواجه تحديين رئيسيين: (i) تدهور جودة الصورة بسبب امتصاص الضوء، و(ii) قيود التخزين المادية التي تحد من جمع الصور ذات الدقة العالية. تركز الطرق الحالية بشكل أساسي على تحسين الصور باستخدام نهج تعتمد على تخزين الإدخال الكامل. في المقابل، نقدم معمارية جديدة تسمى "المشفر المعزز بالكبسولات والمولد التلقائي المتغير" (Capsule Enhanced Variational AutoEncoder - CE-VAE)، وهي مصممة لضغط وتحسين الصور تحت الماء بفعالية عالية. يمكن لمشفِّر الصور الذي يعتمد على الانتباه لدينا أن ي映射输入图像到潜在空间表示上,同时能够在远程设备上在线运行。需要存储在设备上或发送到信标的唯一信息是压缩后的表示。有一个双解码器模块负责离线生成全尺寸增强图像。一个分支从压缩的潜在空间重建空间细节,而第二个分支利用胶囊聚类层捕捉实体级结构和复杂的空间关系。这种并行解码策略使模型能够在精细细节保留和上下文感知增强之间取得平衡。CE-VAE在六个基准数据集上的水下图像增强性能达到了最先进的水平,提供的压缩效率比现有方法高出高达3倍。代码可在\url{https://github.com/iN1k1/ce-vae-underwater-image-enhancement}获取。注:由于阿拉伯语是从右向左书写的,以下是调整后的版本:تحليل الصور تحت الماء بدون طيار لرصد البيئة البحرية يواجه تحديين رئيسيين: (i) تدهور جودة الصورة بسبب امتصاص الضوء، و(ii) قيود التخزين المادية التي تحد من جمع الصور ذات الدقة العالية. تركز الطرق الحالية بشكل أساسي على تحسين الصور باستخدام نهج تعتمد على تخزين الإدخال الكامل. في المقابل، نقدم معمارية جديدة تسمى "المشفر المعزز بالكبسولات والمولد التلقائي المتغير" (المشفر المعزز بالكبسولات والمولد التلقائي المتغير - CE-VAE)، وهي مصممة لضغط وتحسين الصور تحت الماء بفعالية عالية. يمكن لمشفِّر الصور الذي يعتمد على الانتباه لدينا أن يقوم بتحويل صورة الإدخال إلى تمثيل فضائي ضمني بينما يتمكن من العمل عبر الإنترنت على جهاز بعيد. المعلومات الوحيدة التي يجب تخزينها على الجهاز أو إرسالها إلى النقطة المرجعية هي التمثيل المضغوط. يوجد وحدة فك الشفرة ثنائية تقوم بإنشاء صورة محسنة كاملة الحجم خارج الإنترنت. فرع واحد يقوم بإعادة بناء التفاصيل الفضائية من الفضاء ضمني المضغوط، بينما يستخدم الفرع الثاني طبقة تصنيف الكبسولات لالتقاط الهياكل والعلاقات الفضائية المعقدة على مستوى الكيانات. هذه الاستراتيجية متوازية لفك الشفرة تمكِّن النموذج من تحقيق التوازن بين حفظ التفاصيل الدقيقة والتحسينات الواعية بالسياق. يصل أداء CE-VAE في تحسين صور تحت الماء إلى المستوى الرائد في ستة مجموعات بيانات معيارية، حيث يوفر كفاءة ضغط أعلى بمقدار ثلاثة أضعاف من الأساليب الموجودة. يمكن الحصول على الكود من \url{https://github.com/iN1k1/ce-vae-underwater-image-enhancement}.