EfficientDet: كشف كائنات قابل للتوسع والكفاءة

أصبحت كفاءة النماذج أمرًا متزايد الأهمية في الرؤية الحاسوبية. في هذه الورقة، نقوم بدراسة منهجية لاختيارات تصميم بنية الشبكات العصبية للكشف عن الكائنات، ونُقدّم عدة تحسينات رئيسية لتعزيز الكفاءة. أولاً، نقترح شبكة هرمية للسمات ثنائية الاتجاه ذات وزن (BiFPN)، التي تتيح دمجًا سريعًا وسهلًا للسمات متعددة المقاييس؛ ثانيًا، نقترح طريقة تكبير مركب (Compound Scaling) تُكثِّف بشكل موحد الدقة، والعمق، والعرض لجميع الشبكات الأساسية، وشبكات السمات، وشبكات التنبؤ بالصناديق/الفئات في نفس الوقت. وباستخدام هذه التحسينات إلى جانب بنى أساسية مُحسَّنة، طوّرنا عائلة جديدة من كاشفات الكائنات تُسمى EfficientDet، التي تحقق كفاءة أفضل بكثير مقارنة بالتقنيات السابقة عبر طيف واسع من القيود الموارد. وبشكل خاص، مع نموذج واحد وقياس واحد، تحقق EfficientDet-D7 أداءً رائدًا في مجال التقييم (55.1 AP) على مجموعة بيانات COCO test-dev، مع 77 مليون معلمة و410 مليار عملية فلوب (FLOPs)، وهي أصغر بـ 4 إلى 9 أضعاف وأقل استهلاكًا للعمليات الحسابية بنسبة 13 إلى 42 مرة مقارنة بالكاشفات السابقة. يمكن الوصول إلى الشفرة المصدرية من خلال الرابط التالي: https://github.com/google/automl/tree/master/efficientdet.