تقدير التدفق المتوسط في الزمن الفعلي لاستيفاء إطارات الفيديو

يُعد تداخل إطارات الفيديو في الزمن الفعلي (VFI) أداةً مفيدة للغاية في معالجة الفيديو ومشغلات الوسائط وأجهزة العرض. نقترح خوارزمية RIFE، وهي خوارزمية تقدير التدفق المتوسط في الزمن الفعلي لتطبيقات تداخل الإطارات. ولتحقيق طريقة عالية الجودة قائمة على التدفق لـ VFI، تستخدم RIFE شبكة عصبية تُسمى IFNet، التي تقدر التدفقات المتوسطة من الطرف إلى الطرف بسرعة كبيرة جدًا. كما تم تصميم خطة استخلاص مميزة (privileged distillation scheme) لضمان تدريب مستقر لشبكة IFNet وتحسين الأداء العام. لا تعتمد RIFE على نماذج تدفق بصري مُدرَّبة مسبقًا، ويمكنها دعم تداخل الإطارات بفترات زمنية عشوائية بفضل إدخال الترميز الزمني. أظهرت التجارب أن RIFE تحقق أداءً متفوقًا على العديد من المعايير العامة. مقارنةً بالأساليب الشائعة مثل SuperSlomo وDAIN، فإن RIFE أسرع بـ 4 إلى 27 مرة وتُنتج نتائج أفضل. علاوةً على ذلك، يمكن توسيع تطبيقات RIFE بفضل الترميز الزمني. يمكن الوصول إلى الكود المصدر من خلال الرابط التالي: https://github.com/megvii-research/ECCV2022-RIFE.