NAFSSR: تحسين دقة الصور المجسمة باستخدام NAFNet

يهدف التحسين الفائق للصورة الاستيريو إلى تحسين جودة نتائج التحسين الفائق من خلال استخدام المعلومات المكملة التي توفرها الأنظمة الثنائية. لضمان أداء معقول، تركز معظم الطرق على تصميم وحدات وخوارزميات الخسارة وما إلى ذلك بدقة عالية لاستغلال المعلومات من وجهة نظر أخرى. وهذا له تأثير جانبي يتمثل في زيادة تعقيد النظام، مما يجعل من الصعب على الباحثين تقييم الأفكار الجديدة ومقارنة الطرق. في هذا البحث، تم اعتماد نموذج قوي وبسيط لإعادة إنشاء الصور يُعرف بـ NAFNet (نافنت) لاستخراج الميزات من وجهة النظر الواحدة وتم توسيعه بإضافة وحدات الانتباه المتقاطع لدمج الميزات بين وجهات النظر لتكييفه مع السيناريوهات الثنائية. تم تسمية النموذج المقترح كأساس للتحسين الفائق للصورة الاستيريو بـ NAFSSR (نافسر). بالإضافة إلى ذلك، تم اقتراح استراتيجيات التدريب والاختبار للاستفادة الكاملة من أداء NAFSSR (نافسر). أظهرت التجارب الواسعة فعالية طريقتنا. بشكل خاص، حقق NAFSSR (نافسر) أفضل النتائج مقارنة بالطرق الرائدة في مجاله على مجموعات البيانات KITTI 2012، KITTI 2015، Middlebury (مiddleware)، وFlickr1024 (فلكر1024). باستخدام NAFSSR (نافسر)، حصلنا على المركز الأول في تحدي التحسين الفائق للصورة الاستيريو NTIRE 2022. سيتم إطلاق الكود والنماذج في https://github.com/megvii-research/NAFNet.