Command Palette
Search for a command to run...
تقدير التدفق البصري باستخدام شبكة هرمية مكانيّة
تقدير التدفق البصري باستخدام شبكة هرمية مكانيّة
Ranjan Anurag Black Michael J.
الملخص
نُدرِّسُ حساب التدفق البصري من خلال دمج صيغة هرمية فضائية كلاسيكية مع التعلم العميق. ويُقدِّر هذا الأسلوب الحركات الكبيرة بطريقة تُطبَّق من التفصيل الخشن إلى التفصيل الدقيق، وذلك بتحريك صورة من زوج الصور عند كل مستوى هرمي وفقًا لتقدير التدفق الحالي، ثم حساب تحديث لتدفق التدفق. بدلًا من التقليل القياسي لدالة الهدف عند كل مستوى هرمي، نُدرِّس شبكة عميقة واحدة لكل مستوى لحساب التحديث في التدفق. وعلى عكس النهج الحديث المُسمَّى FlowNet، لا تتعيَّن على الشبكات التعامل مع الحركات الكبيرة، إذ تُعالج هذه الحركات بواسطة الهيكل الهرمي. ويتمتع هذا النهج بعدة مزايا. أولاً، فإن شبكتنا الهرمية المكانية (SPyNet) أبسط بكثير من FlowNet، وحجم نموذجها يقل بنسبة 96٪ من حيث عدد المعلمات. ما يجعلها أكثر كفاءة، وبالتالي أكثر ملاءمة للتطبيقات المدمجة. ثانيًا، وبما أن التدفق عند كل مستوى هرمي يكون صغيرًا (أقل من بيكسل واحد)، فإن استخدام نهج تبادلي (Convolutional) على أزواج الصور المتحركة يكون مناسبًا. ثالثًا، وعلى عكس FlowNet، تظهر المرشحات التبادلية المُتعلمة مشابهة للمرشحات المكانية-الزمنية الكلاسيكية، مما يُقدِّم رؤى حول الأسلوب وطريقة تحسينه. وقد أظهرت نتائجنا دقة أعلى من FlowNet في معظم المعايير القياسية القياسية، مما يشير إلى اتجاه جديد يتمثل في دمج الطرق الكلاسيكية للتدفق مع التعلم العميق.