HyperAIHyperAI
منذ 2 أشهر

تقييم جودة الصور بدون رؤية باستخدام شبكة عصبية ت💬لسيمية ثنائية الخط بعمق

Weixia Zhang; Kede Ma; Jia Yan; Dexiang Deng; Zhou Wang
تقييم جودة الصور بدون رؤية باستخدام شبكة عصبية ت💬لسيمية ثنائية الخط بعمق
الملخص

نقترح نموذجًا عمقًا ثنائي الخط للتقدير الأعمى لجودة الصور (BIQA) يتعامل مع التشوهات المصنعة والحقيقية على حد سواء. يتكون نموذجنا من شبكتين عصبيتين تبادليتين (CNN)، كل منها متخصص في سيناريو تشويه معين. بالنسبة للتشوهات المصنعة، نقوم بتدريب مسبق لشبكة عصبية تبادلية لتصنيف نوع ومستوى تشويه الصورة، حيث نستفيد من بيانات تدريبية على نطاق واسع. أما بالنسبة للتشوهات الحقيقية، فنعتمد على شبكة عصبية تبادلية تم تدريبها مسبقًا لتصنيف الصور. يتم دمج الخصائص من الشبكتين العصبيتين التبادليتين بطريقة ثنائية الخط في تمثيل موحد لأجل التنبؤ النهائي بجودة الصورة. ثم نقوم بتuning النموذج بأكمله على قواعد بيانات ذات تصنيفات موضوعية باستخدام طريقة تعديل الدرجات العشوائية (stochastic gradient descent). تظهر التجارب الواسعة أن النموذج المقترح يحقق أداءً أفضل بكثير على قواعد البيانات المصنعة والحقيقية. بالإضافة إلى ذلك، نؤكد قابلية تعميم طريقتنا على قاعدة بيانات Waterloo Exploration باستخدام مسابقة الفروق القصوى للمجموعة.注释:在最后一句中,“group maximum differentiation competition” 是一个不太常见的术语,因此我在阿拉伯语译文中保留了英文标注以确保信息的完整性。

تقييم جودة الصور بدون رؤية باستخدام شبكة عصبية ت💬لسيمية ثنائية الخط بعمق | أحدث الأوراق البحثية | HyperAI