شبكة التحسين الديناميكي للكشف عن الكائنات الموجهة والممتلئة كثافة

حققت الكشف عن الكائنات تقدماً ملحوظاً خلال العقد الماضي. ومع ذلك، لا يزال الكشف عن الكائنات الموجهة والمكدسة بكثافة يُعد تحدياً بسبب الأسباب الجوهرية التالية: (1) مجالات الاستقبال (receptive fields) للخلايا العصبية تكون جميعها محاذاة للمحاور وذات شكل واحد، بينما تكون الكائنات عادةً ذات أشكال متنوعة وتميل إلى توجهات مختلفة؛ (2) تُدرَّب نماذج الكشف عادةً باستخدام معرفة عامة وقد لا تُظهر أداءً جيداً في التعامل مع كائنات محددة أثناء الاختبار؛ (3) قلة توفر المجموعات البيانات يعيق تطوير هذا المجال. ولحل المشكلتين الأولى والثانية، نقدّم شبكة تحسين ديناميكية تتكون من مكونين جديدين، وهما: وحدة اختيار الميزات (FSM) ورأس التحسين الديناميكي (DRH). تتيح وحدة اختيار الميزات (FSM) للخلايا العصبية تعديل مجالات استقبالها بما يتناسب مع أشكال وتوجهات الكائنات المستهدفة، في حين تمكّن وحدة التحسين الديناميكي (DRH) نموذجنا من تحسين التنبؤات بشكل ديناميكي وبطريقة تأخذ بعين الاعتبار طبيعة الكائن. ولحل مشكلة قلة توفر المعايير المرجعية ذات الصلة، جمعنا مجموعة بيانات واسعة ومُعلّمة بالكامل، تُدعى SKU110K-R، والتي أُعيد تسميتها باستخدام مربعات حدود موجهة بناءً على مجموعة SKU110K. أجرينا تقييمات كمية على عدة معايير مفتوحة المصدر، منها DOTA وHRSC2016 وSKU110K وDataset الخاص بنا SKU110K-R. أظهرت النتائج التجريبية أن طريقتنا تحقق مكاسب مستمرة وملحوظة مقارنة بالطرق الأساسية. يمكن الوصول إلى الشفرة والبيانات من خلال الرابط: https://github.com/Anymake/DRN_CVPR2020.