HyperAIHyperAI

Command Palette

Search for a command to run...

SwinFIR: إعادة النظر في SwinIR مع التفاف فورييه السريع وتحسين التدريب لزيادة دقة الصور

Dafeng Zhang Feiyu Huang Shizhuo Liu Xiaobing Wang Zhezhu Jin

الملخص

حققت الطرق المستندة إلى الشبكات العصبية التحويلية (Transformers) أداءً ملحوظًا في استعادة الصور بفضل قدرتها على نمذجة الارتباطات الطويلة المدى مقارنة بالطرق المستندة إلى الشبكات العصبية الم��ية (CNN). ومع ذلك، فإن التطورات مثل طريقة SwinIR تتبني استراتيجية الانتباه القائمة على النوافذ والمحلي لموازنة الأداء والتكلفة الحسابية، مما يحد من استخدام حقول الاستقبال الكبيرة لالتقاط المعلومات العالمية وإنشاء ارتباطات طويلة في الطبقات الأولى. لتحسين كفاءة التقاط المعلومات العالمية بشكل أكبر، نقترح في هذا العمل طريقة SwinFIR لتوسيع نطاق SwinIR من خلال استبدال مكونات التحويل الفوري السريع (Fast Fourier Convolution - FFC)، والتي تتمتع بحقل استقبال يغطي الصورة بأكملها. كما نعيد النظر في تقنيات متقدمة أخرى مثل تحسين البيانات، التدريب المسبق، ودمج الخصائص لتحسين فعالية إعادة بناء الصور. وطريقة دمج الخصائص الخاصة بنا تمكن من تعزيز أداء النموذج بشكل كبير دون زيادة وقت التدريب أو الاختبار. قدمنا خوارزميتنا على عدة مقاييس شهيرة وكبيرة الحجم وأحرزنا أداءً رائدًا مقارنة بالطرق الموجودة حاليًا. على سبيل المثال، حققت طريقة SwinFIR لدينا نسبة PSNR تبلغ 32.83 ديسيبل على مجموعة بيانات Manga109، وهي أعلى بمقدار 0.8 ديسيبل من أفضل طريقة موجودة حاليًا وهي SwinIR.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp