التشبيك متعدد المجالات باستخدام كتل الالتفاف المتغيرة والانتباه الذاتي

رغم أن التعلم العميق قد أحدث تأثيرًا كبيرًا في مجال استعادة الصور والفيديوهات وتحسين الدقة، فإن الاهتمام الأكاديمي أو الصناعي بتعلم فك التداخل (deinterlacing) كان أقل حتى الآن. وهذا رغم أن فك التداخل يتناسب جيدًا مع التعلم الإشرافي من البيانات المصنعة نظرًا لأن نموذج التدهور معروف ومحدد. في هذا البحث، نقترح شبكة فك تداخل متعددة الحقول ذات معدل إطار كامل، والتي تقوم بتكييف أفضل الأساليب الحديثة لتحسين الدقة لمهام فك التداخل. يُحاذا نموذجنا الخصائص من الحقول المجاورة إلى حقل مرجعي (سيتم فكه) باستخدام كلاً من الكتل المتبقية للالتفاف القابل للتكييف والانتباه الذاتي (self attention). تُظهر النتائج التجريبية الواسعة التي أجريناها أن الطريقة المقترحة توفر أفضل النتائج في مجال فك التداخل من حيث الأداء العددي والمدرك. وفي وقت كتابة هذا البحث، يحتل نموذجنا المركز الأول في لوحة تصنيف معدل الإطار الكامل على الرابط https://videoprocessing.ai/benchmarks/deinterlacer.html