Command Palette
Search for a command to run...
PWC-Net: الشبكات العصبية التلافيفية لتدفق بصري باستخدام الهرم، والتحوير، وحجم التكلفة
PWC-Net: الشبكات العصبية التلافيفية لتدفق بصري باستخدام الهرم، والتحوير، وحجم التكلفة
Sun Deqing Yang Xiaodong Liu Ming-Yu Kautz Jan
الملخص
نقدّم نموذجًا صغيرًا لكنه فعّال من نوع الشبكات العصبية التلافيفية (CNN) لحساب التدفق البصري، يُسمّى PWC-Net. وقد صُمّم PWC-Net وفقًا لمبادئ بسيطة وثابتة: المعالجة الهرمية، والتشويه (warping)، واستخدام حجم التكلفة (cost volume). وبصيغة هرمية قابلة للتعلم، يستخدم PWC-Net التقدير الحالي للتدفق البصري لتشويه ميزات الشبكة العصبية التلافيفية للصورة الثانية. ثم يُستخدم التمثيل المشوّه مع ميزات الصورة الأولى لبناء حجم تكلفة، الذي يُعالج بوساطة شبكة عصبية تلافيفية لتقدير التدفق البصري. ويُعدّ PWC-Net أصغر بنسبة 17 مرة من نموذج FlowNet2 الحديث، وأسهل في التدريب. علاوةً على ذلك، يتفوّق على جميع الطرق المنشورة لحساب التدفق البصري في معايير MPI Sintel (المرحلة النهائية) وKITTI 2015، مع تشغيله بسرعة تقارب 35 إطارًا في الثانية على صور بحلّة Sintel (1024×436). يمكن الوصول إلى نماذجنا عبر الرابط: https://github.com/NVlabs/PWC-Net.