HyperAIHyperAI
منذ 17 أيام

PP-PicoDet: كاشف كائنات في الوقت الفعلي أفضل على الأجهزة المحمولة

Guanghua Yu, Qinyao Chang, Wenyu Lv, Chang Xu, Cheng Cui, Wei Ji, Qingqing Dang, Kaipeng Deng, Guanzhong Wang, Yuning Du, Baohua Lai, Qiwen Liu, Xiaoguang Hu, Dianhai Yu, Yanjun Ma
PP-PicoDet: كاشف كائنات في الوقت الفعلي أفضل على الأجهزة المحمولة
الملخص

إن التوازن بين الدقة والكفاءة يُعدّ مشكلة صعبة في كشف الكائنات. وفي هذا العمل، نحن نُركّز على دراسة التحسينات الأساسية واختيارات بنية الشبكة العصبية لتحسين الدقة والكفاءة في كشف الكائنات. ونستكشف مدى ملاءمة الاستراتيجية الخالية من المُعلّقات (anchor-free) بالنسبة إلى نماذج كشف الكائنات الخفيفة. ونُحسّن بنية الخلفية (backbone) ونُصمم هيكلًا خفيفًا للجزء الأوسط (neck)، مما يُعزز قدرة الشبكة على استخلاص الميزات. كما نُحسّن استراتيجية تعيين التسميات ووظيفة الخسارة (loss function) لجعل التدريب أكثر استقرارًا وكفاءة. ومن خلال هذه التحسينات، نُنشئ عائلة جديدة من كاشفات الكائنات في الزمن الحقيقي، تُسمى PP-PicoDet، والتي تحقق أداءً متميزًا في كشف الكائنات على الأجهزة المحمولة. وتُظهر نماذجنا توازنًا أفضل بين الدقة والتأخير مقارنةً بالنماذج الشهيرة الأخرى. فمثلاً، يحقق نموذج PicoDet-S الذي يحتوي فقط على 0.99 مليون معلمة، دقة mAP تبلغ 30.6%، أي تحسنًا مطلقًا بنسبة 4.8% في mAP، مع تقليل زمن التنبؤ على وحدة المعالجة المركزية المحمولة بنسبة 55% مقارنةً بـ YOLOX-Nano، ويحقق تحسنًا مطلقًا بنسبة 7.1% في mAP مقارنةً بـ NanoDet. كما يُحقق أداءً يصل إلى 123 إطارًا في الثانية (150 إطارًا في الثانية باستخدام Paddle Lite) على وحدة المعالجة المركزية المحمولة من نوع ARM عند حجم المدخلات 320. أما نموذج PicoDet-L الذي يحتوي فقط على 3.3 مليون معلمة، فيحقق mAP تبلغ 40.9%، أي تحسنًا مطلقًا بنسبة 3.7% في الدقة، وأسرع بنسبة 44% من YOLOv5s. كما هو موضح في الشكل 1، تتفوق نماذجنا بشكل كبير على أفضل النتائج المُحققة حاليًا في مجال كشف الكائنات الخفيفة. يمكن الوصول إلى الكود والنماذج المُدرّبة مسبقًا من خلال الرابط التالي: https://github.com/PaddlePaddle/PaddleDetection.

PP-PicoDet: كاشف كائنات في الوقت الفعلي أفضل على الأجهزة المحمولة | أحدث الأوراق البحثية | HyperAI