HyperAIHyperAI
منذ 17 أيام

التفرع الذاتي متعدد الرؤى لفصل الصور العامة من الضوضاء

Hao Chen, Chenyuan Qu, Yu Zhang, Chen Chen, Jianbo Jiao
التفرع الذاتي متعدد الرؤى لفصل الصور العامة من الضوضاء
الملخص

بفضل التحسينات الكبيرة في الأداء، أصبح نموذج التعلم العميق أداة قياسية لمرشحات الصور الحديثة من الضوضاء. وعلى الرغم من الأداء الواعد الذي أظهره النماذج الحالية على توزيعات الضوضاء المرئية، إلا أن النهج الحالي غالبًا ما يعاني من ضعف الأداء في التعميم على أنواع الضوضاء غير المرئية أو الضوضاء العامة والواقعية. ويكون هذا أمرًا مفهومًا نظرًا لأن النموذج صُمم لتعلم التمثيل المزدوج (مثل من صورة مشوهة إلى نسخة نظيفة لها). في هذه الورقة، نقترح بدلًا من ذلك تعلم فصل الصورة المشوهة، وذلك بناءً على الفرضية البديهية التي تنص على أن النسخ المختلفة المُشوهَة لنفس الصورة النظيفة تشارك في فضاء لاتنت مشتركًا. ونُقدِّم إطارًا للتعلم ذاتي التحفيز لتحقيق هذا الهدف، دون الحاجة إلى رؤية الصورة النظيفة اللاتينية. وباستخدام نسختين مختلفتين من الصورة المشوهة لنفس الصورة كمدخلات، يتعلم النهج المقترح المعروف باسم "الانفصال ذاتي الرؤية متعددة الأوجه (MeD)" فصل الميزات اللاتينية النظيفة عن العوامل المشوهة، وبالتالي استرجاع الصورة النظيفة. وقد أظهرت التحليلات التجريبية الواسعة على ضوضاء مُصَنَّعة وواقعية تفوق الطريقة المقترحة على النماذج ذاتية التحفيز السابقة، وخاصةً في التعامل مع أنواع جديدة من الضوضاء غير المرئية. وعلى ضوضاء الواقع، تفوقت الطريقة المقترحة حتى على نماذج التعلم المراقبة بنسبة تزيد عن 3 ديسيبل.