HyperAIHyperAI
منذ 17 أيام

شبكة نواة جزئية دورية لتقدير تدفق بصري فعّال

{Xu-Cheng, Xiangyang; Yin, Xiaobin; Ji, Henrique; Zhu, Morimitsu}
شبكة نواة جزئية دورية لتقدير تدفق بصري فعّال
الملخص

يُعد تقدير التدفق البصري مهمة صعبة تتمثل في توقع متجهات الحركة لكل بكسل بين الصور. وقد اعتمدت الطرق الحديثة على نماذج أكبر وأكثر تعقيدًا لتحسين دقة التقدير. ومع ذلك، فإن هذا الأمر يؤثر سلبًا على الانتشار الواسع لطرق التدفق البصري، ويُعقّد تدريب نماذج أكثر شمولية نظرًا لصعوبة الحصول على بيانات التدفق البصري. تقدم هذه الورقة نموذجًا صغيرًا وفعالًا لتقدير التدفق البصري. قمنا بتصميم مشغل ترميز تكراري مكاني جديد يستخرج ميزات تمييزية بحجم مخفض بشكل كبير. على عكس الوحدات التكرارية القياسية، نستخدم طبقات التحويل التكاملي الجزئي (PKConv) لإنتاج ميزات متعددة المقياس بحجم موحد مشترك. كما صممنا أيضًا وحدات كتل كبيرة منفصلة فعالة (SLK) لالتقاط معلومات السياق الواسعة بتكلفة حسابية منخفضة. أظهرت التجارب على معايير عامة أننا حققنا أداءً عامًا يُعد الأفضل في الفئة، مع الحاجة إلى عدد أقل بكثير من المعلمات والذاكرة مقارنة بالطرق المنافسة. وتصدر نموذجنا الترتيب الأول في معيار Spring دون تدريب مخصص، مُحسّنًا النتائج بنسبة تزيد عن 10%، مع الحاجة إلى عدد من العمليات الحسابية (FLOPs) أقل بمرتبة واحدة، وأقل من أربع مرات في استهلاك الذاكرة مقارنة بالطريقة المنشورة التالية دون تدريب مخصص.