Command Palette
Search for a command to run...
شبكة عصبية عميقة متعددة المقياس موحدة للكشف السريع عن الكائنات
شبكة عصبية عميقة متعددة المقياس موحدة للكشف السريع عن الكائنات
Cai Zhaowei Fan Quanfu Feris Rogerio S. Vasconcelos Nuno
الملخص
تم اقتراح شبكة عصبية عميقة موحدة، تُعرف باسم الشبكة العصبية التلافيفية متعددة المقاييس (MS-CNN)، للكشف السريع عن الكائنات متعددة المقاييس. تتكون شبكة MS-CNN من شبكة فرعية لتقديم الاقتراحات (proposal sub-network) وشبكة فرعية للكشف (detection sub-network). في الشبكة الفرعية لتقديم الاقتراحات، يتم إجراء الكشف على طبقات إخراج متعددة، بحيث تتطابق مجالات الاستقبال (receptive fields) مع كائنات ذات مقاييس مختلفة. وتم دمج هذه الكاشفات المحددة حسب المقياس، التي تكمّل بعضها البعض، لإنتاج كاشف كائنات متعدد المقاييس قوي. وتم تدريب الشبكة الموحدة بشكل كامل من البداية إلى النهاية، من خلال تحسين دالة خسارة متعددة المهام. كما تم استكشاف عملية رفع دقة الميزات باستخدام التفكيك التلافيفي (deconvolution) كبديل لرفع دقة الإدخال، بهدف تقليل تكاليف الذاكرة والحساب. وقد تم الإبلاغ عن أداء متميز في كشف الكائنات، يصل إلى 15 إطارًا في الثانية، على مجموعات بيانات مثل KITTI وCaltech، التي تحتوي على عدد كبير من الكائنات الصغيرة.