SDT-DCSCN لتحسين حدة الصورة وتنعيمها المتزامنين للصور النصية

لقد حققت الشبكات العصبية العميقة ذات التحويلات التلافيفية العميقة (Deep CNN) أداءً واعدًا في تحسين دقة الصور الفردية. وبخاصة، تم تطبيق بنية الشبكة المعرفة باسم DCSCN (الاتصال المُتَجاوز للشبكة العميقة ذات التحويلات التلافيفية والشبكة في الشبكة) بنجاح على تحسين دقة الصور الطبيعية. في هذا العمل، نقترح منهجية تُسمى SDT-DCSCN تقوم بتحسين دقة الصورة وتصحيح التشويش بشكل متزامن لصور نصية ضعيفة الدقة ومشوهة، وذلك بناءً على بنية DCSCN. تعتمد منهجيتنا على استخدام صور مشوهة مُستخرجة بعشوائية (مُقَلَّصة) كمدخلات، والصور الحادة الأصلية كصورة مرجعية (ground truth). ويتميز المُعمَّل المستخدم بوجود عدد أكبر من الفلاتر في الطبقة الأولى للشبكة العصبية التلافيفية (CNN) لتحليل أدق للتفاصيل النصية. وأثبتت التقييمات الكمية والكيفية على مجموعات بيانات مختلفة أداءً عاليًا لنموذجنا في إعادة بناء صور نصية عالية الدقة وحادة. وبالإضافة إلى ذلك، فإن المنهجية المقترحة تُظهر أداءً تنافسيًا من حيث الوقت الحسابي مقارنة بالأساليب المتطورة حديثًا.