RAFT: تحولات الحقل الزوجية المتكررة للتدفق البصري

نقدم بنية شبكة عميقة جديدة تُسمى تحولات الحقل لكل أزواج التكرار (RAFT)، لحساب التدفق البصري. تقوم RAFT باستخراج ميزات لكل بكسل، وبناء أحجام ترابط رباعية الأبعاد متعددة المقاييس لكل أزواج البكسل، ثم تحديث حقل التدفق بشكل تكراري من خلال وحدة تكرارية تقوم بعمليات بحث في أحجام الترابط. حققت RAFT أداءً يُعدّ الأفضل في مجالها. على مجموعة بيانات KITTI، حققت RAFT خطأً في F1-all قدره 5.10٪، ما يمثل تقليلًا بنسبة 16٪ في الخطأ مقارنةً بأفضل نتيجة منشورة سابقة (6.10٪). وعلى مجموعة بيانات Sintel (المرور النهائي)، حصلت RAFT على خطأ في نقطة النهاية بقيمة 2.855 بكسل، أي تقليلًا بنسبة 30٪ في الخطأ مقارنةً بأفضل نتيجة منشورة سابقة (4.098 بكسل). علاوةً على ذلك، تمتلك RAFT قدرة قوية على التعميم عبر المجموعات المختلفة، بالإضافة إلى كفاءة عالية في وقت الاستدلال، وسرعة التدريب، وعدد المعاملات. يمكن الوصول إلى الكود عبر الرابط: https://github.com/princeton-vl/RAFT.