{ Xuelong Li Jungong Han Yanwei Pang Jiale Cao}

الملخص
يُنبِّئ كاشف الصدمة الواحدة (Single Shot Detector) عن فئات الكائنات وانحرافات الانحدار للصناديق الافتراضية في آنٍ واحد. وعلى الرغم من الكفاءة العالية، فإن هذا الهيكل يحتوي على بعض التصاميم غير المناسبة: (1) يتم تعيين نتيجة التصنيف للصندوق الافتراضي بشكل غير صحيح إلى نتيجة الصندوق الناتج عن الانحدار أثناء الاستدلال، (2) لا يكفي الانحدار مرة واحدة لتحقيق كشف دقيق للكائنات. ولحل المشكلة الأولى، تم اقتراح وحدة جديدة تُسمى ROC (reg-offset-cls)، التي تتضمن ثلاث خطوات تسلسلية: انحدار الصندوق، وتقدير موقع عينة الميزة، ثم تصنيف الصندوق الناتج باستخدام ميزات مواقع الانحراف. ولحل المشكلة الثانية بشكل أعمق، تم اقتراح كاشف صدمة متسلسل (HSD)، الذي يجمع بين وحدتي ROC ووحدة تحسين الميزة. حيث تُستخدم الصناديق الناتجة عن الانحدار ومواقع عينة الميزات من الوحدة الأولى كمدخلات للوحدة الثانية من ROC. في الوقت نفسه، تهدف وحدة تحسين الميزة التي تم دمجها بين وحدتي ROC إلى استخلاص السياق المحلي وغير المحلي. وقد أظهرت التجارب على مجموعتي بيانات MS COCO وPASCAL VOC تفوق الهيكل المقترح HSD. وبلا أي إضافات مكثفة، يتفوق HSD على جميع الطرق من الطراز الواحد في السرعة الزمنية الحقيقية.
مستودعات الكود
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| object-detection-on-coco | HSD (Rest101, 768x768, single-scale test) | AP50: 61.2 AP75: 46.9 APL: 55.9 APM: 47.3 APS: 22.8 Hardware Burden: Operations per network pass: box mAP: 42.3 |
| object-detection-on-pascal-voc-2007 | HSD (VGG16, 512x512, single-scale test) | MAP: 83.0% |
| object-detection-on-pascal-voc-2007 | HSD (VGG16, 320x320, single-scale test) | MAP: 81.7% |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.