HyperAIHyperAI

Command Palette

Search for a command to run...

تقدير التدفق البصري باستخدام شبكة هرمية مكانيّة

Ranjan Anurag Black Michael J.

الملخص

نُدرِّسُ حساب التدفق البصري من خلال دمج صيغة هرمية فضائية كلاسيكية مع التعلم العميق. ويُقدِّر هذا الأسلوب الحركات الكبيرة بطريقة تُطبَّق من التفصيل الخشن إلى التفصيل الدقيق، وذلك بتحريك صورة من زوج الصور عند كل مستوى هرمي وفقًا لتقدير التدفق الحالي، ثم حساب تحديث لتدفق التدفق. بدلًا من التقليل القياسي لدالة الهدف عند كل مستوى هرمي، نُدرِّس شبكة عميقة واحدة لكل مستوى لحساب التحديث في التدفق. وعلى عكس النهج الحديث المُسمَّى FlowNet، لا تتعيَّن على الشبكات التعامل مع الحركات الكبيرة، إذ تُعالج هذه الحركات بواسطة الهيكل الهرمي. ويتمتع هذا النهج بعدة مزايا. أولاً، فإن شبكتنا الهرمية المكانية (SPyNet) أبسط بكثير من FlowNet، وحجم نموذجها يقل بنسبة 96٪ من حيث عدد المعلمات. ما يجعلها أكثر كفاءة، وبالتالي أكثر ملاءمة للتطبيقات المدمجة. ثانيًا، وبما أن التدفق عند كل مستوى هرمي يكون صغيرًا (أقل من بيكسل واحد)، فإن استخدام نهج تبادلي (Convolutional) على أزواج الصور المتحركة يكون مناسبًا. ثالثًا، وعلى عكس FlowNet، تظهر المرشحات التبادلية المُتعلمة مشابهة للمرشحات المكانية-الزمنية الكلاسيكية، مما يُقدِّم رؤى حول الأسلوب وطريقة تحسينه. وقد أظهرت نتائجنا دقة أعلى من FlowNet في معظم المعايير القياسية القياسية، مما يشير إلى اتجاه جديد يتمثل في دمج الطرق الكلاسيكية للتدفق مع التعلم العميق.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp