HyperAIHyperAI
منذ 2 أشهر

الرد الفعلي القابل للتدريب وغير الخطي: إطار مرن لاستعادة الصور بسرعة وكفاءة

Yunjin Chen; Thomas Pock
الرد الفعلي القابل للتدريب وغير الخطي: إطار مرن لاستعادة الصور بسرعة وكفاءة
الملخص

إعادة تكوين الصور هي مشكلة قديمة في مجال الرؤية الحاسوبية من المستوى المنخفض، ولها العديد من التطبيقات المثيرة للاهتمام. نصف في هذا البحث إطارًا مرنًا للتعلم يعتمد على مفهوم نماذج التفاعل والانتشار اللاخطي لمشكلات إعادة تكوين الصور المختلفة. من خلال تبني التحسينات الحديثة في نماذج الانتشار اللاخطي، نقترح نموذج تفاعل وانتشار ديناميكي لاخطي مع معاملات تعتمد على الزمن (أي، مرشحات خطية ودوال تأثير). بخلاف النماذج السابقة للانتشار اللاخطي، يتم تعلم جميع المعاملات، بما في ذلك المرشحات والدوال التأثيرية، بشكل متزامن من بيانات التدريب عبر نهج يستند إلى الخسارة. نطلق على هذا النهج اسم TNRD -- \textit{النموذج القابل للتدريب للتفاعل والانتشار اللاخطي} (Trainable Nonlinear Reaction Diffusion). يمكن تطبيق النهج TNRD على مجموعة متنوعة من مهام إعادة تكوين الصور من خلال دمج قوة تفاعل مناسبة. نوضح قدراته من خلال ثلاثة تطبيقات تمثيلية: إزالة الضوضاء من الصور ذات التوزيع الغاوسي، زيادة دقة الصورة الفردية، وإزالة التشويه الناجم عن ضغط JPEG. أظهرت التجارب أن نماذج الانتشار اللاخطي التي تم تدريبها لدينا استفادت بشكل كبير من تدريب المعاملات وأدت في النهاية إلى أفضل الأداء المبلغ عنه على مجموعات الاختبار الشائعة للمهام المختبرة. تحافظ نماذجنا المدربة على البساطة الهيكلية لنماذج الانتشار وتتطلب فقط عددًا صغيرًا من خطوات الانتشار، مما يجعلها فعالة للغاية. بالإضافة إلى ذلك، فهي أيضًا تناسب الحساب المتوازي على وحدات معالجة الرسوميات (GPUs)، مما يجعل عملية الاستدلال سريعة للغاية.

الرد الفعلي القابل للتدريب وغير الخطي: إطار مرن لاستعادة الصور بسرعة وكفاءة | أحدث الأوراق البحثية | HyperAI