HyperAIHyperAI
منذ 17 أيام

إزالة التمثيل الصوتي للصورة باستخدام مرشحات مرور قابلة للتعلم

Bolun Zheng, Shanxin Yuan, Gregory Slabaugh, Ales Leonardis
إزالة التمثيل الصوتي للصورة باستخدام مرشحات مرور قابلة للتعلم
الملخص

إن إزالة التداخل البصري (Image demoiréing) هو مهمة متعددة الجوانب لإصلاح الصور، ويشمل إصلاح النسيج والألوان معًا. في هذه الورقة، نقترح شبكة عصبية متعددة المقياس ذات تمرير نطاق مُعلَّم (MBCNN) جديدة لمعالجة هذه المشكلة. باعتبارها حلًا من الطرف إلى الطرف، تقوم MBCNN بحل المشكلتين الفرعيتين بشكل منفصل. بالنسبة لإصلاح النسيج، نقترح مرشحًا تردديًا قابلاً للتعلم (LBF) لاستخلاص المعرفة الترددية اللازمة لإزالة نسيج التداخل البصري. أما بالنسبة لإصلاح الألوان، نقترح استراتيجية مزدوجة الخطوات لضبط التوهج، حيث يتم أولًا تطبيق ضبط توهج عالمي لتصحيح الانزياح اللوني العام، ثم إجراء ضبط دقيق محلي لكل بكسل على حدة. من خلال دراسة تحليلية (Ablation Study)، نُظهر فعالية المكونات المختلفة في MBCNN. وتشير النتائج التجريبية على مجموعتي بيانات عامتين إلى أن طريقةنا تتفوق على الطرق الرائدة في مجالها بفارق كبير (أكثر من 2 ديسيبل من حيث PSNR).