HyperAIHyperAI
منذ 2 أشهر

كتلة قابلة للتشغيل الفوري ذات ثلاثة فروع قابلة للعكس لتصغير الصور وإعادة تغيير حجمها

Bao, Jingwei ; Hao, Jinhua ; Xu, Pengcheng ; Sun, Ming ; Zhou, Chao ; Zhu, Shuyuan
كتلة قابلة للتشغيل الفوري ذات ثلاثة فروع قابلة للعكس لتصغير الصور وإعادة تغيير حجمها
الملخص

الصور ذات الدقة العالية (HR) يتم تقليلها عادةً إلى صور ذات دقة منخفضة (LR) لتقليل حجم النطاق الترددي، ثم يتم توسيع نطاقها لاستعادة تفاصيلها الأصلية. وقد استخدمت التطورات الحديثة في خوارزميات إعادة تغيير حجم الصور الشبكات العصبية القابلة للعكس (INNs) لإنشاء إطار موحد للتقليل والتوسيع، مما يضمن وجود علاقة واحد لواحد بين الصور ذات الدقة المنخفضة والصور ذات الدقة العالية. أما الطرق التقليدية التي تعتمد على الكتل القابلة للعكس البسيطة ذات الفروع المزدوجة فتقوم بمعالجة المعلومات عالية التردد ومنخفضة التردد بشكل منفصل، وتستند غالبًا على توزيعات معينة لنمذجة المكونات عالية التردد. ومع ذلك، فإن معالجة المكون منخفض التردد مباشرة في مجال RGB يُدخل تكرارًا في القنوات، مما يحد من كفاءة إعادة بناء الصورة. لمواجهة هذه التحديات، نقترح كتلة قابلة للعكس وقابلة للدمج ثلاثية الفروع (T-InvBlocks) تقوم بتقسيم الفرع منخفض التردد إلى مكونات السطوع (Y) والكروماتسية (CbCr)، مما يقلل من التكرار ويحسن معالجة الخصائص. بالإضافة إلى ذلك، نعتمد استراتيجية الخريطة الصفرية الكاملة للمكونات عالية التردد أثناء عملية توسيع النطاق، مع التركيز على المعلومات الأساسية لإعادة تغيير الحجم داخل الصورة ذات الدقة المنخفضة. يمكن دمج T-InvBlocks الخاصة بنا بسلاسة في النماذج الحالية لإعادة تغيير الحجم، مما يحسّن الأداء في المهام العامة لإعادة تغيير الحجم وفي السيناريوهات التي تتضمن ضغطًا فقدانيًا. وقد أكدت التجارب الواسعة أن طرقنا قد أحدثت تقدمًا كبيرًا في إعادة بناء الصور ذات الدقة العالية.