نشر YOLOv12 بنقرة واحدة
🚀 YOLOv12: خيار متعدد الاستخدامات لمهام الرؤية الحاسوبية، مع أقصى قدر من السرعة والدقة! 🚀

يستخدم هذا البرنامج التعليمي RTX 4090 كمورد للحوسبة.
1. مقدمة البرنامج التعليمي 📖
تم إطلاق YOLOv12 في عام 2025 من قبل باحثين من جامعة بافالو وجامعة الأكاديمية الصينية للعلوم.YOLOv12: أجهزة كشف الأشياء في الوقت الفعلي التي تركز على الانتباه".
لفترة طويلة، كان تعزيز بنية الشبكة لإطار عمل YOLO موضوعًا أساسيًا في مجال الرؤية الحاسوبية. على الرغم من تفوق آلية الانتباه في قدرات النمذجة، فإن التحسينات المستندة إلى CNN لا تزال سائدة لأن النماذج المستندة إلى الانتباه يصعب مطابقتها في السرعة. ومع ذلك، فإن تقديم YOLOv12 غيّر هذا الوضع! إنه ليس فقط قابلاً للمقارنة مع الأطر المستندة إلى CNN من حيث السرعة، ولكنه أيضًا يستفيد بشكل كامل من مزايا الأداء لآلية الانتباه، ليصبح معيارًا جديدًا لاكتشاف الكائنات في الوقت الفعلي.
أداء YOLOv12 الرائد
- يحقق YOLOv12-N mAP يبلغ 40.6% مع زمن استدلال يبلغ 1.64 مللي ثانية على وحدة معالجة الرسوميات T4، وهو أعلى بمقدار 2.1%/1.2% من YOLOv10-N/YOLOv11-N.
- يتفوق YOLOv12-S على RT-DETR-R18 / RT-DETRv2-R18، حيث يعمل بسرعة أكبر بمقدار 42%، ويستخدم 36% فقط من الحسابات، ويقلل المعلمات بمقدار 45%.
📜 تاريخ تطوير YOLO والبرامج التعليمية ذات الصلة
لقد كانت YOLO (You Only Look Once) رائدة في مجال اكتشاف الكائنات وتجزئة الصور منذ إطلاقها في عام 2015. فيما يلي تطور سلسلة YOLO:
- YOLOv2 (2016):مقدمة حول تطبيع الدفعات، وصناديق المرساة، وتجميع الأبعاد.
- YOLOv3 (2018):استخدام شبكات العمود الفقري الأكثر كفاءة، والمراسي المتعددة، وتجميع الهرم المكاني.
- YOLOv4 (2020):تقديم تعزيز بيانات Mosaic ورأس الكشف الخالي من المرساة ووظيفة الخسارة الجديدة. → البرنامج التعليمي:يحقق DeepSOCIAL مراقبة مسافة الحشود استنادًا إلى YOLOv4 وتتبع الأهداف المتعددة
- YOLOv5:تمت إضافة تحسين المعلمات الفائقة وتتبع التجربة ووظائف التصدير التلقائي. → البرنامج التعليمي:نموذج تتبع الأهداف المتعددة في الوقت الفعلي YOLOv5_deepsort
- YOLOv6 (2022):Meituan مفتوح المصدر، يستخدم على نطاق واسع في روبوتات التوصيل المستقلة.
- YOLOv7:يدعم تقدير الوضع لمجموعة بيانات النقاط الرئيسية COCO.
- YOLOv8 (2023)تم إصدار Ultralytics، الذي يدعم مجموعة كاملة من مهام الذكاء الاصطناعي المرئي.
- YOLOv9:مقدمة عن معلومات التدرج القابلة للبرمجة (PGI) وشبكة تجميع الطبقات الفعالة المعممة (GELAN).
- YOLOv10:تم إطلاقه بواسطة جامعة تسينغهوا، وهو يقدم رأسًا من البداية إلى النهاية ويزيل متطلب القمع غير الأقصى (NMS). → البرنامج التعليمي:YOLOv10 الكشف عن الكائنات من البداية إلى النهاية في الوقت الفعلي
- YOLOv11:أحدث طراز من Ultralytics، يدعم الكشف والتجزئة وتقدير الوضع والتتبع والتصنيف. → البرنامج التعليمي:نشر YOLOv11 بنقرة واحدة
- YOLOv12 🚀 جديد:قمم السرعة والدقة المزدوجة، جنبًا إلى جنب مع مزايا الأداء لآلية الانتباه!
2. خطوات التشغيل🛠️
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إن مخرجات كاشف الكائنات عبارة عن مجموعة من المربعات المحددة التي تحيط بالكائنات في الصورة، بالإضافة إلى تسمية الفئة ودرجة الثقة لكل مربع محدد. يعد اكتشاف الكائنات خيارًا جيدًا إذا كنت بحاجة إلى تحديد الكائنات المثيرة للاهتمام في مشهد ما ولكنك لا تحتاج إلى معرفة موقعها الدقيق أو شكلها.
وينقسم إلى الوظيفتين التاليتين:
- كشف الصور
- كشف الفيديو
2. اكتشاف الصورة
المدخل عبارة عن صورة والمخرج عبارة عن صورة تحمل تسمية.


الشكل 1 اكتشاف الصورة
3. اكتشاف الفيديو
المدخل عبارة عن فيديو والمخرج عبارة عن فيديو يحتوي على تسميات.

الشكل 2 كشف الفيديو
🤝 مناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

YOLOv12 ليس مجرد قفزة تكنولوجية فحسب، بل هو أيضًا ثورة في مجال الرؤية الحاسوبية! تعالوا وجربوها! 🚀