RTMDet: دراسة تجريبية لتصميم كاشفات الأشياء في الوقت الحقيقي
RTMDet: دراسة تجريبية لتصميم كاشفات الأشياء في الوقت الحقيقي
Chengqi Lyu Wenwei Zhang Haian Huang Yue Zhou Yudong Wang Yanyi Liu Shilong Zhang Kai Chen

الملخص
في هذا البحث، نهدف إلى تصميم كاشف أهداف في الوقت الحقيقي فعال يتفوق على سلسلة YOLO ويمكن توسيعه بسهولة لمهام متعددة في التعرف على الأهداف مثل تقسيم الحالة (instance segmentation) وكشف الأهداف المدور (rotated object detection). لتحقيق هندسة نموذج أكثر كفاءة، نستكشف بنية تتميز بقدرات متوافقة في العمود الفقري (backbone) والرقبة (neck)، والتي يتم بناؤها من وحدة بناء أساسية تتكون من اثنين من الالتفافات العميقة ذات النواة الكبيرة (large-kernel depth-wise convolutions). كما نقدم تسميات ناعمة (soft labels) عند حساب تكاليف التطابق في التعيين الديناميكي للوسم لتحسين الدقة. بالاشتراك مع تقنيات تدريب أفضل، يحقق الكاشف الناتج، الذي تم تسميته RTMDet، دقة 52.8% AP على COCO بمعدل إطارات يزيد عن 300 إطار في الثانية على وحدة معالجة الرسومات NVIDIA 3090، مما يجعله يتفوق على الكاشفات الصناعية الرئيسية الحالية. يحقق RTMDet أفضل توازن بين المعلمات والدقة بأحجام نماذج صغيرة جداً/صغيرة/متوسطة/كبيرة/كبيرة جداً للمواقف التطبيقية المختلفة، ويحصل على أداء جديد رائد في تقسيم الحالة الزمني وفي كشف الأهداف المدور. نأمل أن توفر النتائج التجريبية رؤى جديدة لتصميم كاشفات أهداف متعددة الاستخدامات وفعالة في الوقت الحقيقي لمجموعة متنوعة من مهام التعرف على الأهداف. تم إطلاق الشيفرة والنماذج في https://github.com/open-mmlab/mmdetection/tree/3.x/configs/rtmdet.
مستودعات الكود
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| object-detection-in-aerial-images-on-dota-1-0 | RTMDet-R-l (single scale) | mAP: 80.16% |
| object-detection-in-aerial-images-on-dota-1-0 | RTMDet-R-l | mAP: 81.33% |
| object-detection-in-aerial-images-on-hrsc2016 | RTMDet-R-tiny | mAP-07: 90.6 mAP-12: 97.10 |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-l | - |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-x | - |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-m | - |
| real-time-instance-segmentation-on-mscoco | RTMDet-Ins-s | - |
| real-time-instance-segmentation-on-mscoco-1k | RTMDet-Ins-x | APM: 49.0 |
| real-time-instance-segmentation-on-multi30k | RTMDet-Ins-s | mask AP: 38.7 |
| real-time-object-detection-on-coco | RTMDet | box AP: 52.8 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.