HyperAIHyperAI
منذ 17 أيام

ML-CrAIST: انتباه متقاطع مبني على معلومات التردد العالي والمنخفض متعدد المقياس مع محول تحسين دقة الصورة

Alik Pramanick, Utsav Bheda, Arijit Sur
ML-CrAIST: انتباه متقاطع مبني على معلومات التردد العالي والمنخفض متعدد المقياس مع محول تحسين دقة الصورة
الملخص

في الآونة الأخيرة، لاقت نماذج الترانسفورمر اهتمامًا كبيرًا في مجال مهام تحسين دقة الصور الفردية، حيث أظهرت تحسينات كبيرة في الأداء. تعتمد النماذج الحالية بشكل كبير على القدرة الواسعة للشبكة على استخراج التفاصيل الشكلية عالية المستوى من الصور، مع إهمال الاستخدام الفعّال للتفاصيل متعددة المقياس والبيانات الوسيطة داخل الشبكة. علاوةً على ذلك، لوحظ أن المناطق عالية التردد في الصور تُعدّ أكثر تعقيدًا في مهام التحسين مقارنةً بالمناطق منخفضة التردد. تقدم هذه الدراسة معمارية تحسين دقة صور قائمة على الترانسفورمر تُسمى ML-CrAIST، والتي تُعالج هذه الفجوة من خلال استغلال المعلومات من الترددات المنخفضة والعالية على مقياس متعدد. على عكس معظم الدراسات السابقة (سواءً في المجال المكاني أو القنوات)، نقوم بتطبيق انتباه مكاني وانتباه قنوات في آنٍ واحد، مما يُمكّن من نمذجة تفاعل البكسل من كلا البعدين المكاني والقناة، واستغلال العلاقات المتأصلة بين المحور المكاني والمحور القناتي. بالإضافة إلى ذلك، طوّرنا بلوك انتباه متقاطع مخصص لتحسين الدقة، يُستكشف من خلاله الترابط بين المعلومات من الترددات المنخفضة والمرتفعة. تُظهر التقييمات الكمية والكيفية أن النموذج المقترح ML-CrAIST يتفوق على أحدث الطرق في مجال تحسين دقة الصور (مثل زيادة قدرها 0.15 ديسيبل عند مقياس Manga109 ×4). يمكن الوصول إلى الكود من خلال الرابط التالي: https://github.com/Alik033/ML-CrAIST.