يولو في 12: تحليل للخصائص المعمارية الرئيسية

تُقدّم هذه الورقة تحليلًا معماريًا لنموذج YOLOv12، الذي يُعد تطورًا مهمًا في مجال الكشف عن الكائنات في الوقت الفعلي من طبقة واحدة، حيث يبني على مزايا النماذج السابقة مع إدخال تحسينات جوهرية. يُدمج في النموذج عصب خلفي مُحسَّن (R-ELAN)، وعمليات تباعدية 7×7، وانتباه مبني على المنطقة مُشغَّل بواسطة FlashAttention، مما يُحسّن استخراج الميزات، ويعزز الكفاءة، ويُعزز دقة الكشف. وبفضل وجود عدة نماذج فرعية، مشابهة لسابقاتها، يُقدّم YOLOv12 حلولًا قابلة للتوسع لتطبيقات حساسة للتأخير، وكذلك لتطبيقات تتطلب دقة عالية. تُظهر النتائج التجريبية تحسينات مستمرة في دقة المتوسط المتوسط (mAP) وسرعة الاستنتاج، مما يجعل YOLOv12 خيارًا جذابًا في مجالات مثل الأنظمة الذاتية القيادة، والأمن، والتحليلات في الوقت الفعلي. وبتحقيق توازن مثالي بين الكفاءة الحسابية والأداء، يُشكّل YOLOv12 معيارًا جديدًا في مجال الرؤية الحاسوبية في الوقت الفعلي، مما يُسهّل نشره على منصات هاردوير متنوعة، من الأجهزة الحافة إلى مجموعات الحوسبة عالية الأداء.