التفرع الذاتي متعدد الرؤى لفصل الصور العامة من الضوضاء

بفضل التحسينات الكبيرة في الأداء، أصبح نموذج التعلم العميق أداة قياسية لمرشحات الصور الحديثة من الضوضاء. وعلى الرغم من الأداء الواعد الذي أظهره النماذج الحالية على توزيعات الضوضاء المرئية، إلا أن النهج الحالي غالبًا ما يعاني من ضعف الأداء في التعميم على أنواع الضوضاء غير المرئية أو الضوضاء العامة والواقعية. ويكون هذا أمرًا مفهومًا نظرًا لأن النموذج صُمم لتعلم التمثيل المزدوج (مثل من صورة مشوهة إلى نسخة نظيفة لها). في هذه الورقة، نقترح بدلًا من ذلك تعلم فصل الصورة المشوهة، وذلك بناءً على الفرضية البديهية التي تنص على أن النسخ المختلفة المُشوهَة لنفس الصورة النظيفة تشارك في فضاء لاتنت مشتركًا. ونُقدِّم إطارًا للتعلم ذاتي التحفيز لتحقيق هذا الهدف، دون الحاجة إلى رؤية الصورة النظيفة اللاتينية. وباستخدام نسختين مختلفتين من الصورة المشوهة لنفس الصورة كمدخلات، يتعلم النهج المقترح المعروف باسم "الانفصال ذاتي الرؤية متعددة الأوجه (MeD)" فصل الميزات اللاتينية النظيفة عن العوامل المشوهة، وبالتالي استرجاع الصورة النظيفة. وقد أظهرت التحليلات التجريبية الواسعة على ضوضاء مُصَنَّعة وواقعية تفوق الطريقة المقترحة على النماذج ذاتية التحفيز السابقة، وخاصةً في التعامل مع أنواع جديدة من الضوضاء غير المرئية. وعلى ضوضاء الواقع، تفوقت الطريقة المقترحة حتى على نماذج التعلم المراقبة بنسبة تزيد عن 3 ديسيبل.