HyperAIHyperAI

Command Palette

Search for a command to run...

تدفق المعلومات الهرمي لاستعادة الصور بطرق معممة وكفوءة

Li Yawei ; Ren Bin ; Liang Jingyun ; Ranjan Rakesh ; Liu Mengyuan ; Sebe Nicu ; Yang Ming-Hsuan ; Benini Luca

الملخص

بينما تظهر نماذج التحويل البصري (Vision Transformers) وعودًا في العديد من مهام استعادة الصور (Image Restoration - IR)، لا يزال التحدي قائماً في تعميم وتضخيم النموذج بكفاءة لمهام متعددة من IR. لموازنة الكفاءة وسعة النموذج في طريقة استعادة الصور المعتمدة على التحويلات بشكل عام، نقترح آلية تدفق المعلومات الهرمية، والتي أطلقنا عليها اسم Hi-IR، والتي تنشر المعلومات بين البكسلات بطريقة تصاعدية من الأسفل إلى الأعلى.يقوم Hi-IR ببناء شجرة معلومات هرمية تمثل الصورة المتدنية الجودة عبر ثلاثة مستويات. يغلف كل مستوى أنواعًا مختلفة من المعلومات، حيث يشمل المستويات الأعلى كائنات ومفاهيم أوسع، بينما يركز المستويات الأدنى على التفاصيل المحلية. بالإضافة إلى ذلك، فإن بنية الشجرة الهرمية تزيل انتباه الذات على المدى الطويل (Long-range Self-Attention)، مما يحسن كفاءة الحساب واستخدام الذاكرة، وبالتالي يعد النموذج للتوسع الفعال. بناءً على ذلك، نستكشف توسع النموذج لتحسين قدرات طريقتنا، وهو ما يتوقع أن يؤثر إيجابياً على IR في بيئات التدريب ذات الحجم الكبير.تظهر النتائج التجريبية الواسعة أن Hi-IR حققت أداءً رائدًا في سبع مهام شائعة لاستعادة الصور، مما يؤكد فعاليتها وقدرتها على التعميم.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp