توفيرات السرعة والدقة للكاشفات الحديثة عن الأشياء باستخدام التوافقيات

هدف هذه الورقة هو أن تكون دليلًا لاختيار هندسة الكشف التي تحقق التوازن الصحيح بين السرعة والذاكرة والدقة لمجال تطبيق معين ومنصة محددة. لتحقيق هذا الهدف، ندرس طرقًا مختلفة لتوفير الدقة مقابل السرعة واستخدام الذاكرة في أنظمة كشف الأشياء الحديثة المستندة إلى الشبكات العصبية التلافيفية. تم اقتراح العديد من الأنظمة الناجحة في السنوات الأخيرة، ولكن المقارنات المباشرة تكون صعبة بسبب الاختلافات في مستخلصات الخصائص الأساسية (مثل VGG، شبكات البقايا)، وفي الدقة الافتراضية للصور، بالإضافة إلى المنصات المادية والبرمجيات المختلفة. نقدم تنفيذًا موحدًا لأنظمة Faster R-CNN [Ren وآخرون، 2015]، R-FCN [Dai وآخرون، 2016] وSSD [Liu وآخرون، 2015]، والتي نراها كـ "هياكل متعددة" ونستعرض منحنى التوفيق بين السرعة والدقة الذي ينشأ من استخدام مستخلصات خصائص بديلة وتغيير معلمات حاسمة أخرى مثل حجم الصورة داخل كل واحدة من هذه الهياكل المتعددة. على أحد طرفي هذا الطيف حيث تكون السرعة والذاكرة حاسمتين، نقدم جهاز كشف يحقق سرعات في الوقت الحقيقي ويمكن نشره على جهاز محمول. وعلى الطرف الآخر حيث تكون الدقة حاسمة، نقدم جهاز كشف يحقق أداءً رائدًا قياسيًا عند قياسه على مهمة الكشف في COCO.