HyperAIHyperAI
منذ 15 أيام

إعادة النظر في النمذجة الزمنية لتحسين دقة الفيديو

Takashi Isobe, Fang Zhu, Xu Jia, Shengjin Wang
إعادة النظر في النمذجة الزمنية لتحسين دقة الفيديو
الملخص

تلعب التحسين العالي للدقة في الفيديو (Video Super-Resolution) دورًا مهمًا في تحليل الفيديوهات المراقبة وعرض الفيديوهات ذات الدقة الفائقة، وقد لاقت اهتمامًا كبيرًا من قبل المجتمعات البحثية والصناعية على حد سواء. وعلى الرغم من اقتراح العديد من الطرق القائمة على التعلم العميق لتحسين دقة الفيديو، فإن من الصعب مقارنة هذه الطرق مباشرةً نظرًا لتأثير كبير يُحدثه استخدام دوال الخسارة المختلفة وقواعد البيانات التدريبية المختلفة على نتائج التحسين. في هذه الدراسة، نقوم بدراسة ومقارنة دقيقة لثلاثة أساليب نمذجة زمنية (CNN ثنائي الأبعاد مع دمج مبكر، وCNN ثلاثي الأبعاد مع دمج بطيء، وشبكة عصبية متكررة). كما نقترح شبكة عصبية متكررة جديدة تُسمى RRN (Recurrent Residual Network) لتحسين دقة الفيديو بشكل فعّال، حيث تُستخدم تقنية التعلم المتبقية (Residual Learning) لاستقرار عملية التدريب للشبكة العصبية المتكررة، وفي الوقت نفسه لتعزيز أداء التحسين. تُظهر التجارب الواسعة أن RRN المُقترحة تتميز بكفاءة حسابية عالية، وتوفر نتائج تحسين دقة فيديو متسقة زمنيًا وبتفاصيل أدق مقارنةً بالأساليب الأخرى لنمذجة الزمن. علاوةً على ذلك، تحقق الطريقة المقترحة نتائج متقدمة على مستوى العالم (state-of-the-art) على عدة معايير شائعة الاستخدام.

إعادة النظر في النمذجة الزمنية لتحسين دقة الفيديو | أحدث الأوراق البحثية | HyperAI