HybridNets: شبكة الإدراك من النهاية إلى النهاية

شبكة النهاية إلى النهاية أصبحت ذات أهمية متزايدة في تنفيذ المهام المتعددة. أحد الأمثلة البارزة على هذا هو الزيادة المستمرة في أهمية نظام الإدراك للقيادة في مجال القيادة الذاتية. تدرس هذه الورقة بشكل منهجي شبكة إدراك من النهاية إلى النهاية للمهام المتعددة وتقترح عدة تحسينات رئيسية لتعزيز الدقة. أولاً، تقترح الورقة رؤوس تقسيم فعالة وشبكات تنبؤ بالصناديق والتصنيف بناءً على الشبكة المميزة ثنائية الاتجاه والموزونة. ثانياً، تقترح الورقة تخصيص الأنشور (anchor) تلقائياً لكل مستوى في الشبكة المميزة ثنائية الاتجاه والموزونة. ثالثاً، تقترح الورقة دالة خسارة تدريب فعالة واستراتيجية تدريب لموازنة وتحسين الشبكة.بناءً على هذه التحسينات، تم تطوير شبكة إدراك من النهاية إلى النهاية قادرة على تنفيذ المهام المتعددة، بما في ذلك كشف الأجسام المرورية، تقسيم المناطق القابلة للقيادة وكشف المسارات بشكل متزامن، وهي ما يُعرف بـ HybridNets، والتي حققت دقة أفضل من التقنيات السابقة. وبشكل خاص، حققت HybridNets متوسط دقة 77.3% على مجموعة بيانات Berkeley DeepDrive، وأفضلت كشف المسارات بمتوسط تقاطع فوق الاتحاد (Intersection Over Union) بنسبة 31.6% مع 12.83 مليون معلمة و15.6 مليار عملية حساب عائم. بالإضافة إلى ذلك، يمكنها تنفيذ مهام الإدراك البصري في الوقت الفعلي وبالتالي فهي حل عملي ودقيق للمشكلة المتعلقة بالمهام المتعددة. الرمز البرمجي متاح على الرابط https://github.com/datvuthanh/HybridNets.