إعادة التفكير في RAFT لتدفق بصري فعّال

على الرغم من التقدم الكبير في أساليب تدفق البصريات المستندة إلى التعلم العميق، تبقى عملية تقدير الانزلاقات الكبيرة وأنماط التكرار دقيقة تحديًا كبيرًا. وترجع هذه المشكلة جزئيًا إلى القيود المفروضة على الميزات المحلية وأنماط البحث عن التشابه المستخدمة في هذه الخوارزميات. بالإضافة إلى ذلك، تعاني بعض الأساليب الحالية من زمن تشغيل بطيء واستهلاك مفرط لذاكرة الرسومات. ولحل هذه المشكلات، تُقدّم هذه الورقة نهجًا جديدًا مستندًا إلى إطار RAFT. يعتمد النهج المقترح، المسمى بتحديد الميزات المدعوم بالانتباه (AFL)، على آلية الانتباه لمعالجة استخراج الميزات العالمية وحل مشكلة الأنماط المتكررة. كما يُقدّم هذا النهج مشغلًا جديدًا لربط البكسلات بمضاداتها المقابلة في الإطار الثاني وتخصيص قيم تدفق دقيقة. علاوة على ذلك، تم اقتراح مشغل بحث غير منتظم (ALO) لتعزيز سرعة التقارب وتحسين قدرة RAFT على التعامل مع الانزلاقات الكبيرة، وذلك من خلال تقليل التكرار في البيانات داخل مشغل البحث وتوسيع نطاق مساحة البحث لاستخراج التشابه. وحققت الطريقة المقترحة، Ef-RAFT، تحسينات كبيرة بنسبة 10% على مجموعة بيانات Sintel و5% على مجموعة بيانات KITTI مقارنةً بـ RAFT. وبشكل لافت، تم تحقيق هذه التحسينات مع خفض طفيف بنسبة 33% في السرعة وزيادة ضئيلة بنسبة 13% في استهلاك الذاكرة. يمكن الوصول إلى الكود من خلال: https://github.com/n3slami/Ef-RAFT