Command Palette
Search for a command to run...
الإشراف المُشفَّر تلقائيًا للتحسين البصري للصورة
الإشراف المُشفَّر تلقائيًا للتحسين البصري للصورة
MinKyu Lee Sangeek Hyun Woojin Jun Jae-Pil Heo
الملخص
يتعامل هذا العمل مع هدف الولاء في مسألة التكبير البصري (SR). وبشكل خاص، نعالج العيوب الناتجة عن استخدام خسارة المستوى البكسيلي Lp (Lpix) في الإطار المبني على الشبكات التوليدية التفاعلية (GAN). ونظرًا لوجود علاقة تناقض بين Lpix ونوعية الإدراك البصري، غالبًا ما تستخدم الطرق السابقة عاملًا مقياسًا صغيرًا أو تطبق مرشحات منخفضة التردد. ولكن يُظهر هذا العمل أن هذه الحلول البديلة لا تحل العامل الجذري المسؤول عن التشويش. وعليه، نركّز على نقطتين رئيسيتين: 1) التمييز بدقة للمكون الفرعي لـ Lpix الذي يساهم في التمويه، و2) التوجيه فقط بناءً على العامل الذي لا يخضع لعلاقة التناقض هذه. ونُظهر أن هاتين النقطتين يمكن تحقيقهما بطريقة مفاجئة بسيطة، باستخدام مُشفّر تلقائي (AE) مُدرّب مسبقًا باستخدام Lpix. وبناءً عليه، نقترح خسارة جديدة تُسمى "الإشراف المُشفّر التلقائي للعقاب الأمثل" (LAESOP)، وهي خسارة تقيس المسافة في فضاء المُشفّر التلقائي، بدلًا من فضاء البكسل الأصلي. ويُشير فضاء المُشفّر التلقائي إلى الفضاء الناتج بعد عملية الترميز (decoder)، وليس الفضاء المركزي (bottleneck). وباستبدال Lpix بسهولة بـ LAESOP، يمكننا توفير توجيه فعّال لإعادة البناء دون التضحية بجودة الإدراك البصري. وتم تصميم هذه الطريقة ببساطة، مما يمكّن من دمجها بسهولة في الإطارات الحالية لتكبير الصور. وتوصّل النتائج التجريبية إلى أن AESOP يمكن أن تُحقق نتائج مُرضية في مهام التكبير البصري.