HyperAIHyperAI
منذ 17 أيام

DAMO-YOLO: تقرير حول تصميم الكشف عن الكائنات في الزمن الفعلي

Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
DAMO-YOLO: تقرير حول تصميم الكشف عن الكائنات في الزمن الفعلي
الملخص

في هذا التقرير، نقدّم طريقةً سريعة ودقيقة للكشف عن الكائنات تُسمّى DAMO-YOLO، والتي تحقق أداءً أعلى من سلسلة YOLO الأحدث في المجال. تم تطوير DAMO-YOLO باستفادة من تقنيات جديدة مُضافة إلى YOLO، تشمل بحث البنية العصبية (Neural Architecture Search - NAS)، وبنية FPN المعمّمة الفعّالة مع إعادة تشكيل (RepGFPN)، ورأس كشف خفيف الوزن يعتمد على تعيين التسميات AlignedOTA، بالإضافة إلى تحسين عبر التعلم المُدمج (distillation enhancement). وبشكل خاص، نستخدم منهج MAE-NAS، الذي يُوجّه بحسب مبدأ الانتروبيا العظمى، لاستكشاف هيكل الخلفية (backbone) للكشف ضمن قيود زمن استجابة منخفض وتحقيق أداء عالٍ، ما أنتج هياكل مشابهة لـ ResNet/CSP تضم وحدات تجميع الهرم المكاني (spatial pyramid pooling) ووحدات التركيز (focus modules). وفي تصميم "الرقبة" (neck) والرأس (head)، نلتزم بقاعدة "الرقبة الكبيرة، والرأس الصغير". وقد قمنا بدمج FPN المعمّمة مع تحسين دمج الملكات (queen-fusion) لبناء رقبة الكاشف، كما قمنا بتحديث CSPNet باستخدام شبكات تجميع الطبقات الفعّالة (ELAN) وإعادة التشكيل. ثم قمنا بدراسة تأثير حجم الرأس على أداء الكشف، ووجدنا أن رقبة ثقيلة مع طبقة واحدة فقط لتحويل المهمة تُنتج نتائج أفضل. علاوةً على ذلك، تم اقتراح AlignedOTA لحل مشكلة عدم التماثل في تعيين التسميات. كما تم تقديم مخطط تعلم مُدمج (distillation schema) لتحسين الأداء إلى مستوى أعلى. وباستخدام هذه التقنيات الجديدة، قمنا ببناء مجموعة من النماذج بمختلف المقاييس لتلبية احتياجات سيناريوهات متنوعة. بالنسبة للمتطلبات الصناعية العامة، نقترح نماذج DAMO-YOLO-T/S/M/L، التي تحقق مؤشرات mAP قدرها 43.6/47.7/50.2/51.9 على مجموعة بيانات COCO، بزمن استجابة 2.78/3.83/5.62/7.95 مللي ثانية على وحدات معالجة T4. وبالإضافة إلى ذلك، لجهاز الحافة (edge devices) ذات القوة الحاسوبية المحدودة، قمنا أيضًا بتطوير نماذج خفيفة الوزن DAMO-YOLO-Ns/Nm/Nl، والتي تحقق مؤشرات mAP قدرها 32.3/38.2/40.5 على COCO، بزمن استجابة 4.08/5.05/6.69 مللي ثانية على وحدات معالجة X86-CPU. وقد تفوّقت النماذج العامة والخفيفة التي نقترحها على النماذج الأخرى في سلسلة YOLO في سياقاتها التطبيقيّة المحددة.

DAMO-YOLO: تقرير حول تصميم الكشف عن الكائنات في الزمن الفعلي | أحدث الأوراق البحثية | HyperAI