HyperAIHyperAI

Command Palette

Search for a command to run...

KBNet: شبكة أساس النواة لاستعادة الصور

Yi Zhang Dasong Li Xiaoyu Shi Dailan He Kangning Song Xiaogang Wang Hongwei Qin Hongsheng Li

الملخص

كيفية تجميع المعلومات المكانية تلعب دورًا أساسيًا في استعادة الصور القائمة على التعلم. تعتمد معظم الشبكات الحالية القائمة على CNN على نوى التحويل الثابتة لتشفير المعلومات المكانية، والتي لا تستطيع تجميع المعلومات المكانية بطريقة متكيفة. حققت الأطر الحديثة القائمة على المتحولات (transformers) تجميعًا مكانيًا متكيفًا، لكنها تعاني من عدم وجود التحيزات الاستقرائية المرغوبة للتحويلات وتحتاج إلى تكاليف حسابية ثقيلة. في هذا البحث، نقترح وحدة انتباه أساس النواة (Kernel Basis Attention - KBA)، والتي تقوم بتقديم أسس نواة قابلة للتعلم لنمذجة الأنماط الصورية الممثلة لتجميع المعلومات المكانية. يتم تدريب أسس النواة المختلفة لنمذجة الهياكل المحلية المختلفة. في كل موقع مكاني، يتم دمجها بشكل خطي ومتكيف بواسطة معاملات بيكسلية متوقعة للحصول على أوزان التجميع. بناءً على وحدة KBA، صممنا أيضًا كتلة دمج الخصائص متعددة المحاور (Multi-Axis Feature Fusion - MFF) لترميز ودمج الخصائص القناوية، والمكانيّة غير المتغيرة، والبيكسلية المتكيفة لاستعادة الصور. يحقق نموذجنا، الذي سُمي بشبكة أساس النواة (Kernel Basis Network - KBNet)، أداءً رائدًا في أكثر من عشر مقاييس مرجعية لأعمال إزالة الضوضاء وإزالة الأمطار وإزالة التشويش في الصور، مع الحاجة إلى تكاليف حسابية أقل من الطرق الرائدة السابقة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp