مرشح الصور الهرمي

يُنبِّئ كاشف الصدمة الواحدة (Single Shot Detector) عن فئات الكائنات وانحرافات الانحدار للصناديق الافتراضية في آنٍ واحد. وعلى الرغم من الكفاءة العالية، فإن هذا الهيكل يحتوي على بعض التصاميم غير المناسبة: (1) يتم تعيين نتيجة التصنيف للصندوق الافتراضي بشكل غير صحيح إلى نتيجة الصندوق الناتج عن الانحدار أثناء الاستدلال، (2) لا يكفي الانحدار مرة واحدة لتحقيق كشف دقيق للكائنات. ولحل المشكلة الأولى، تم اقتراح وحدة جديدة تُسمى ROC (reg-offset-cls)، التي تتضمن ثلاث خطوات تسلسلية: انحدار الصندوق، وتقدير موقع عينة الميزة، ثم تصنيف الصندوق الناتج باستخدام ميزات مواقع الانحراف. ولحل المشكلة الثانية بشكل أعمق، تم اقتراح كاشف صدمة متسلسل (HSD)، الذي يجمع بين وحدتي ROC ووحدة تحسين الميزة. حيث تُستخدم الصناديق الناتجة عن الانحدار ومواقع عينة الميزات من الوحدة الأولى كمدخلات للوحدة الثانية من ROC. في الوقت نفسه، تهدف وحدة تحسين الميزة التي تم دمجها بين وحدتي ROC إلى استخلاص السياق المحلي وغير المحلي. وقد أظهرت التجارب على مجموعتي بيانات MS COCO وPASCAL VOC تفوق الهيكل المقترح HSD. وبلا أي إضافات مكثفة، يتفوق HSD على جميع الطرق من الطراز الواحد في السرعة الزمنية الحقيقية.