شبكة انتباه متعدد تكيفية ذات مرحلة واحدة لاسترجاع الصور
في الآونة الأخيرة، أظهرت الشبكات القائمة على الانتباه نجاحًا كبيرًا في مهام استعادة الصور. ومع ذلك، فإن الطرق الحالية إما تكون مكلفة من حيث الحساب أو تمتلك مجالات استقبال محدودة، مما يفرض قيودًا على النموذج. كما أنها أقل مقاومة من حيث الجوانب المكانية والسياقية، وتفتقر إلى تطابق بين البكسلات، مما قد يؤدي إلى تدهور تمثيل الميزات. في هذا البحث، نقترح معمارية جديدة وفعالة من حيث الحساب، تُسمى الشبكة الأحادية المرحلة ذات الانتباه المتعدد التكيف (SSAMAN)، لمهام استعادة الصور، وخاصة إزالة الضوضاء من الصور وتصحيح الضبابية. تتعامل SSAMAN بشكل فعّال مع التحديات الحسابية، وتوسع مجالات الاستقبال، مما يعزز المقاومة في تمثيل الميزات المكانية والسياقية. يتألف وحدة الانتباه المتعدد التكيف (AMAM) من فرع الانتباه البكسيلي التكيفي (APAB) وفرع الانتباه القنوي التكيفي (ACAB)، حيث يدمج هذا التصميم بشكل فريد بين الأبعاد القنوية والبكسلية، مما يُحسّن بشكل كبير من الحساسية تجاه الحواف والأشكال والأنسجة. قمنا بإجراء تجارب واسعة ودراسات تحليلية (أبلايشن ستوديز) للتحقق من أداء SSAMAN. أظهر نموذجنا نتائج رائدة في مجال التقنيات الحديثة على مجموعة متنوعة من المعايير، حيث حقق 40.08 ديسيبل في معيار PSNR على مجموعة بيانات SIDD في مهام إزالة الضوضاء، متفوقًا على نموذج Restormer بمقدار 0.06 ديسيبل، مع تقليل تكلفة الحساب بنسبة 41.02٪، كما حقق 40.05 ديسيبل في معيار DND. أما في مهام تصحيح الضبابية، فقد حقق SSAMAN 33.53 ديسيبل في معيار PSNR على مجموعة بيانات GoPro. يمكن الاطلاع على الكود والنماذج على منصة GitHub.