M2Det: منظم كائنات بضربة واحدة يستند إلى شبكة الهرم المتعددة المستويات للخصائص

تُستخدم الأهرامات المميزة على نطاق واسع من قبل كاشفات الكائنات ذات المرحلة الواحدة المتقدمة (مثل DSSD، RetinaNet، RefineDet) وكاشفات الكائنات ذات المرحلتين (مثل Mask R-CNN، DetNet) لتخفيف المشكلة الناجمة عن التباين في الحجم بين حالات الكائنات. رغم أن هذه كاشفات الكائنات التي تستخدم الأهرامات المميزة حققت نتائج مشجعة، إلا أنها تعاني من بعض القيود بسبب أنها تقوم ببساطة ببناء الهرم المميز اعتمادًا على البنية متعددة المقاييس والمثلثة للأساسيات التي تم تصميمها في الواقع لمهام تصنيف الكائنات. حديثًا، في هذا العمل، نقدم طريقة تُسمى شبكة الهرم المميز متعدد المستويات (MLFPN) لبناء أهرامات مميزة أكثر فعالية لاكتشاف كائنات بأحجام مختلفة. أولاً، نقوم بتجميع الميزات متعددة المستويات (أي الطبقات المتعددة) المستخرجة بواسطة الأساس كميزات أساسية. ثانيًا، نُدخل الميزات الأساسية إلى مجموعة من الوحدات الشكل-يو الرفيعة والوحدات المدمجة للميزات البديلة واستغلال طبقات الفك لكل وحدة شكل-يو كميزات لاكتشاف الكائنات. أخيرًا، نجمع طبقات الفك ذات المقاييس (الأحجام) المكافئة لتطوير هرم مميز لاكتشاف الكائنات، حيث تتكون كل خريطة ميزاتها من طبقات (ميزات) مستوياتها المتعددة.لتقييم فعالية الشبكة المقترحة MLFPN، قمنا بتصميم وتدريب كاشف كائن قوي يعمل بشكل كامل من مرحلة واحدة أطلقنا عليه اسم M2Det وذلك بدمجه في بنية SSD، مما يحقق أداءً أفضل في الاكتشاف مقارنة بكاشفات الكائنات ذات المرحلة الواحدة المتقدمة الأخرى. تحديدًا، على مقاييس MS-COCO القياسية، يحقق M2Det دقة AP 41.0 بمعدل 11.8 صورة في الثانية باستخدام استراتيجية الاستدلال ذات المقاس الواحد ودقة AP 44.2 باستخدام استراتيجية الاستدلال متعددة المقاسات، وهي النتائج الجديدة الأكثر تقدمًا بين كاشفات الكائنات ذات المرحلة الواحدة. سيتم توفير الرمز البرمجي على الرابط \url{https://github.com/qijiezhao/M2Det}.