HyperAIHyperAI
منذ 17 أيام

YOLOv4: الأداء الأمثل للسرعة والدقة في كشف الكائنات

Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
YOLOv4: الأداء الأمثل للسرعة والدقة في كشف الكائنات
الملخص

تُعدّ هناك عدد كبير من الميزات التي يُقال إنها تحسّن دقة الشبكات العصبية التلافيفية (CNN). ويتطلب الأمر إجراء اختبارات عملية على مجموعات بيانات كبيرة لاختبار التوليفات المختلفة لهذه الميزات، إلى جانب تبرير نظري للنتائج الناتجة. بعض هذه الميزات تعمل فقط على نماذج معينة ولمشاكل محددة، أو تكون فعّالة فقط على مجموعات بيانات صغيرة؛ في حين أن بعض الميزات الأخرى، مثل التطبيع بالدُفعات (Batch-Normalization) والاتصالات المتبقية (Residual-Connections)، يمكن تطبيقها على معظم النماذج والمهمات ومجموعات البيانات. نفترض أن الميزات الشاملة التي تُطبّق بشكل عام تشمل الاتصالات المتبقية الموزونة (Weighted-Residual-Connections - WRC)، والاتصالات الجزئية عبر المراحل (Cross-Stage-Partial-connections - CSP)، والتطبيع المتقاطع بين دفعات صغيرة (Cross mini-Batch Normalization - CmBN)، والتدريب المُضاد الذاتي (Self-adversarial-training - SAT)، ووظيفة التنشيط ميش (Mish-activation). وقد استخدمنا ميزات جديدة مثل: WRC، CSP، CmBN، SAT، وظيفة التنشيط ميش، وتمديد البيانات موساييك (Mosaic data augmentation)، وCmBN مرة أخرى، وتنظيم DropBlock، ودالة الخسارة CIoU، ودمجنا بعض هذه الميزات لتحقيق نتائج من الطراز الرائد: 43.5% AP (65.7% AP50) على مجموعة بيانات MS COCO بسرعة في الزمن الفعلي تقارب 65 إطارًا في الثانية على وحدة معالجة الرسوميات Tesla V100. يمكن الاطلاع على الكود المصدري عبر الرابط: https://github.com/AlexeyAB/darknet

YOLOv4: الأداء الأمثل للسرعة والدقة في كشف الكائنات | أحدث الأوراق البحثية | HyperAI