HomoFormer: تحويلة متجانسة للإزالة التلقائية للظلال في الصور

تتعارض عدم التجانس المكاني وأنماط الظل المتنوعة في تدهور الصورة مع نمط مشاركة الأوزان المهيمن في النماذج الحالية، مما قد يؤدي إلى تنازل غير راضٍ. ولحل هذه المشكلة، نقدم في هذه الورقة استراتيجية جديدة من منظور تحويل الظل: توحيد التوزيع المكاني لتدهور الظل مباشرةً. يعتمد تصميمنا الأساسي على عملية التبديل العشوائي وعملية التبديل العكسي المقابلة لها. وبشكل محدد، تقوم عملية التبديل العشوائي بإعادة ترتيب البكسلات بشكل عشوائي عبر الفضاء المكاني، بينما تقوم العملية العكسية بإعادة استرجاع الترتيب الأصلي. وبعد تطبيق التبديل العشوائي، ينتشر تدهور الظل عبر الصورة بأكملها، ويظهر التدهور بشكل متجانس، مما يمكن معالجته بكفاءة بواسطة طبقة الانتباه الذاتي المحلية. علاوةً على ذلك، قمنا بتصميم شبكة تغذية أمامية جديدة تضم نمذجة الموضع لاستغلال المعلومات البنائية للصورة. وباستناد إلى هذه العناصر، قمنا ببناء نموذج الترانسفورمر القائم على النافذة المحلية النهائية المسمى "HomoFormer" لاسترجاع الصور من تأثير الظل. يمكن لنموذج HomoFormer الاستمتاع بالتعقيد الخطي للنماذج الترانسفورمر المحلية، مع تجاوز التحديات الناتجة عن عدم التجانس والتنوع في تدهور الظل. أجرينا تجارب واسعة لتأكيد التفوق المميز لنموذج HomoFormer عبر مجموعات بيانات عامة.