HyperAIHyperAI
منذ 17 أيام

شبكة تجميع دورية خفيفة الوزن لتحسين دقة مقاطع الفيديو الساتلية

{Manqi Zhao, Shengyang Li, Han Wang}
الملخص

أصبح المعالجة الذكية والتحليل للفيديوهات الساتلية واحدة من الموضوعات البحثية البارزة في تمثيل الاستشعار عن بعد، وتمثّل إعادة بناء الدقة الفائقة لفيديوهات السواتل (SVSR) اتجاهًا بحثيًا مهمًا يمكنه تحسين جودة الصور في الفيديوهات الساتلية. ومع ذلك، فإن الطرق الحالية لـ SVSR تُهمل غالبًا ميزة بارزة متأصلة في الفيديوهات الساتلية: وجود صور متسلسلة واسعة النطاق تُصوّر مشهدًا ثابتًا. في الوقت الحالي، تعتمد معظم أساليب SVSR على عدد محدود من الإطارات المجاورة لتحسين دقة الإطار الفردي، مما يؤدي إلى استخدام غير كافٍ للمعلومات. لمعالجة هذه المشكلة، نقدّم إطارًا جديدًا يُسمّى شبكة التجميع المتكرر لاستعادة دقة الفيديو الساتلي (RASVSR). يعتمد هذا الإطار المبتكر على شبكة عصبية متكررة ثنائية الاتجاه لنقل الميزات المستخلصة من كل إطار عبر التسلسل الكامل للفيديو. ويعتمد على طريقة محاذاة تعتمد على التدفق البصري (optical flow) والانحناء القابل للتعديل (DCN) لتحقيق محاذاة فعّالة للميزات، ويُستخدم وحدة دمج الميزات الزمنية (TFF) لتحقيق دمج فعّال للميزات عبر الزمن. وبشكل ملحوظ، تُبرز أبحاثنا التأثير الإيجابي لاستخدام تسلسلات صور أطول في SVSR. وفي سياق RASVSR، وبفضل محاذاة ودمج أفضل، نمكّن من تمديد المجال الإدراكي لكل إطار ليشمل 100 إطارًا من الفيديو، مما يسمح باستخلاص معلومات أكثر غنىً، مع إمكانية تكميل المعلومات بين الصور المختلفة. يؤدي هذا النهج الاستراتيجي إلى أداء متفوّق مقارنة بالأساليب الأخرى، كما يظهر من خلال تحسّن ملحوظ في معيار PSNR بنسبة 1.15 ديسيبل، مع عدد ضئيل جدًا من المعاملات.