HyperAIHyperAI
منذ 2 أشهر

YOLOv11: مراجعة للتحسينات المعمارية الرئيسية

Rahima Khanam; Muhammad Hussain
YOLOv11: مراجعة للتحسينات المعمارية الرئيسية
الملخص

تقدم هذه الدراسة تحليلًا معماريًا لـ YOLOv11، أحدث إصدار في سلسلة نماذج الكشف عن الأشياء YOLO (You Only Look Once). نقوم بفحص الابتكارات المعمارية للنموذج، بما في ذلك إدخال كتلة C3k2 (Cross Stage Partial مع حجم النواة 2)، ومركبة SPPF (Spatial Pyramid Pooling - Fast)، وكتلة C2PSA (Convolutional block with Parallel Spatial Attention)، والتي تسهم في تحسين أداء النموذج بعدة طرق مثل استخراج الميزات بشكل أفضل. يتناول البحث توسيع قدرات YOLOv11 في مجموعة متنوعة من مهام الرؤية الحاسوبية، بما في ذلك الكشف عن الأشياء، والتقسيم الفردي، وتقدير الوضع، والكشف عن الأشياء المنحازة (OBB). نراجع تحسينات أداء النموذج من حيث الدقة المتوسطة (mAP) والكفاءة الحسابية مقارنةً بإصداراته السابقة، مع التركيز على التوازن بين عدد المعلمات والدقة. بالإضافة إلى ذلك، تناقش الدراسة مرونة YOLOv11 عبر أحجام النماذج المختلفة، من النانو إلى الكبير جدًا، لتلبية احتياجات التطبيقات المتنوعة من أجهزة الحافة إلى بيئات الحوسبة ذات الأداء العالي. يقدم بحثنا رؤى حول مكانة YOLOv11 ضمن المناظر الأوسع للكشف عن الأشياء وتأثيره المحتمل على تطبيقات الرؤية الحاسوبية الفورية.

YOLOv11: مراجعة للتحسينات المعمارية الرئيسية | أحدث الأوراق البحثية | HyperAI